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Capítulo 1 


Topologia do Espaço Euclidiano 


1 O espaço euclidiano n-dimensional 


Seja n um número natural. O espaço euclidiano n-dimensional R” é o produto 
cartesiano de n fatores iguais a R : R” = Rx Rx...x R. Seus elementos, 
portanto, são as segiiências (ou listas) den termos reais x = (x1,..., Xn). Para cada 
i=1,...,n,otermo x; chama-seai-ésima coordenada de x. Sex = (X1,...,Xn) 
e y = (Yr, ---, Yn), tem-se x = y se, e somente se, x1 = )1,...,Xn = Yn. Ássim, 
toda igualdade entre dois elementos de R” equivale a n igualdades entre números 
reais. R! = R é o conjunto dos números reais, R? é o modelo numérico do plano e 
R? é o modelo do espaço euclidiano tridimensional. Por simplicidade, adotaremos 
o hábito de escrever z = (x, y) em vez de x = (x1, X2) e w = (x, y, z) em vez de 
x = (x1, X2, X3). 

Os elementos de R” às vezes são chamados pontos e às vezes vetores. Es- 
te segundo nome se aplica principalmente quando se considerarem entre eles as 
operações que definiremos agora. 

A adição faz corresponder a cada par de elementos x = (x1, ..., Xn) € 


y = (Y1; ---, Yn) à soma 
x+y = (x1 +)... + Yn). 


e a multiplicação do número real œ pelo elemento x = (x1, ..., Xn) tem 
como resultado o produto 


æ- x = (X1, ..., 4X). 
O vetor O = (0,0,...,0), cujas coordenadas são todas nulas, chama-se a 
origem de R”. Para todo x = (x1, ... , Xn), O vetor —x = (—x1, ..., —Xn) chama- 


se o oposto, ou simétrico de x. Dados quaisquer x, y, z € R” e œ, 8 € R valem as 
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igualdades 


x+y=y+x, x+0=x, —x+x=0, 
x+0O+z)=@œ+y)+z, «(x)= (aB)x, 
(œ + B)x=ax+Bx, a(lx+ty)=ax+ay. 


A segunda e a terceira delas dizem que O é o elemento neutro da adição e —x é 
o inverso aditivo de x. 

Os vetores e, = (1,0,...,0), e2 = (0,1,0,...,0),...en = (0,...,1), que 
têm uma única coordenada não-nula, igual a 1, constituem a base canônica de R”. 


A igualdade x = (x1,...,Xn) significa que x = xı ce, + + Xn: €n. 
Existe ainda uma operação que associa a cada par de vetores x = (x1,..., Xn), 
y = (y1, ---, Yn) O número real 


(x, yY) = X11 + + XnYn, 


chamado o produto interno de x por y. 
Para x, y,z € R” e œ € R quaisquer, tem-se 


(oy)=(yx) (x,y +z) =(x, y) +(x,z), 
(ax,y)=a-(x,7), (x,x)>0 se xo. 


Segue-se que (x+y, z ) = (x, y)}+(x, y), (x,y) =a(x,y)e(x,0) = 0. 

Diz-se que os vetores x, y € R” são ortogonais, e escreve-se x L y, quando 
(x,y) = 0. Por exemplo, (e; ej) = O sei £ j. 

Um exemplo menos trivial de ortogonalidade é o seguinte 


(x,y) p 
“xe 


(1.1) Seja x e R” não-nulo. Para todo y € R”, o vetor z = y — / ) 
X,X 


ortogonal a x. 


y) = 
BE -(x,x)=0. 


Demonstração. (x,7)= (x,y) — 


(x,y) 


Escrevendo y = -x +z, vemos assim que, uma vez dado um vetor 


não-nulo x e R”, todo vetor y € R” se escreve como soma de um múltiplo de x 
com um vetor ortogonal a x. Esta decomposição é única pois se y = q :x +z 
com z L x, tomando-se o produto interno de ambos os membros por x obtemos 
(x,y) =a- (2,2), logoæ = (x, y)/(x, x}. O vetor ax = ((x, y)/(x,x})x 
chama-se a projeção ortogonal de y sobre (a reta que contém) x. 
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y Y 
l 


O a $ 
Lxx? 


Figura 1. 


O número não-negativo |x| = (x, x) chama-se a norma (ou o comprimento) 
do vetor x. Sex = (x1, .. - , Xn) então 


|x| = x? + H x2. 


Por definição, tem-se (x, x) = |x|?. Quando |x| = 1, diz-se que x é um vetor 
unitário. Para todo x Æ 0, o vetor u = x/|x]| é unitário. 


(1.2) (Teorema de Pitágoras). Se x L y então |x + y|? = |x|? + |y|>. 


Demonstração. |x + yl? = (x+y, x+y) = (x,x)+2(x,y)+(y,y) = 
(x, x) + (y, y) = Ix2 +y. 


(1.3) (Desigualdade de Schwarz). Para quaisquer x, y € R”, tem-se |(x, y)| < 
|x|- |y], valendo a igualdade se, e somente se, um dos vetores x, y é múltiplo do 
outro. 


Demonstração. Isto é óbvio se x = O. Supondo x +Æ 0, podemos escrever y = 
ax+zcomz Lxea=(x,y)/|x|2. Por Pitágoras, Iyl? = «2|x|2 + izl? logo 
|y]? > a?|x|2, valendo a igualdade se, e somente se, y = a - x. Entrando com o 
valor de a, vem |y|? > (x,y)?/|x|?, ou seja, (x,y)? < |x]? - |y|P, o que nos dá 
(x, y)| < |x|- |y], valendo a igualdade se, e somente se, y = q - x. 


A norma goza das seguintes propriedades: 
1. |x| > 0, valendo |x| = O somente quando x = 0; 
2. |æ -x| = |æ] |x]; 


3. |x + y| < |x| + Iyl. 
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A última desigualdade, referindo-se a números não-negativos, equivale a 
2 
x +y? < (lx + Iyi)“. 
Ora, 
wtf = (x +yx+9)=|xÊ+20,9)+ DÊ 
2 
< [xP +2lxllyl + yÊ = (lx + Iyi) 


pois, em virtude da desigualdade de Schwarz, (x, y) < |x| |y]. 
Mais geralmente, qualquer função R” — R, que associe a cada vetor x € R” 
um número |x| com as três propriedades acima, chama-se uma norma. A norma 


lx] =4/x? + + a2, 


chama-se norma euclidiana. 
Há duas outras normas que poderemos utilizar em R” quando houver conve- 
niência. Elas são 


1. |xly = max - flxil, a Ixa} (norma do máximo), 
2. Ixls=|xil4+---+|x,] (norma da soma). 
As condições que definem uma norma são fáceis de verificar para estas duas. 
Também é simples mostrar que, para todo x € R”, vale 
lxlm <Ixi<Irs<n-|yo, 


onde |x| é a norma euclidiana. 

Quando, num determinado contexto, estivermos usando apenas uma das normas 
|xly ou |x|s, podemos indicá-la com a notação |x|, por simplicidade. 

Para toda norma, vale a desigualdade 


[xl = Iyi] < lx — yl. 


Com efeito, de x = (x — y) + y resulta que |x| < |x — y|+ |yl, logo |x| — |y| < 
|x — yl. 

Trocando os papéis de x e y, obtemos |y| — |x| < |y — x|. Mas |y — x| = 
|x — yl, logo |y| — |x| < |x — yl. Conclusão: | |x| — [y| | < |x — yl. 

Uma norma em R” dá origem à noção de distância d(x, y) entre dois pontos 
x,y € R”. Para x = (x1, ..., Xn) € y = (Y1, ---, Yn), pomos 


d(x, y) = |x — y| = V &1 = y)? +- H (Xn — Yn)? 


As três condições que definem uma norma implicam que d(x, y) tem as pro- 
priedades características de uma distância, a saber: 
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1. d(x, y) > 0, com d(x, y) = 0 se, e somente se, x = y; 
2. d(x, y) = d(y, x); 
3. d(x,z) < d(x, y) + d(y, z) (desigualdade triangular). 


Observe que a igualdade |œ -x| = |æ| |x| coma = —1 dá | — x| = |x], logo 
|x — y| = |y — x|. Além disso, |x — z| = |x — y+ y= z| < |x — y| + |y — zl, 
portanto d(x,z) < d(x, y) + d(y, z). 


2 Bolas e conjuntos limitados 


Dados o ponto a € R” e o número realr > 0, a bola aberta de centro a e raio r 
é o conjunto B (a; r) dos pontos x € R” cuja distância ao ponto a é menor que r. 
Em símbolos: 


B(a; r) = {x € R"; ix —al <r}. 


Analogamente, a bola fechada de centro a e raio r é o conjunto B[a; r] assim 
definido: 


B[a; r] = fx e R”; |x— al <r}. 
Por sua vez, a esfera de centro a e raio r é o conjunto 
Sla; r] = fx e R”; |x — al =r}. 


Evidentemente, B[a; r] = B(a; r) U S[a; r]. 

A bola fechada B[a;r] c R” também é chamada o disco n-dimensional de 
centro a e raio r. Em particular, o disco B[0; 1] de centro O e raio 1 é chamado o 
disco unitário de R”. 

Uma notação especial é reservada para a esfera unitária de dimensão n — 1: 


S"! = fx € R”; x| = 1}. 


P4 


Assim, S”! é a esfera de centro na origem 0 e raio 1. Quando n = 2, S! éa 
circunferência de centro 0 e raio 1. 

Acima estamos (pelo menos tacitamente) admitindo que a norma adotada em 
R” é a euclidiana, já que não foi feita menção em contrário. Convém, entretanto, 
observar que a forma geométrica das bolas e esferas em R” depende da norma que 
se considera. Por exemplo, se tomarmos em R? a norma do máximo, a “esfera 
unitária” é o bordo do quadrado de centro 0 e lados de comprimento 2, paralelos 
aos eixos. Ainda em R?, com a norma da soma, o “disco unitário” é o quadrado 
cujos vértices são os pontos (1,0), (0,1), (—1, 0) e (0, —1). 
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(a) (b) (c) 


Figura 2. O conjunto dos pontos z € R” tais que |z| < 1, conforme a norma seja (a) a 
euclidiana; (b) do máximo, ou (c) da soma. 


Observação. Indiquemos com as notações B, By e Bs respectivamente as bolas 
de centro a e raio r em R”, relativamente às normas euclidiana, do máximo e da 
soma. Seja ainda Bj, a bola de centro a e raio r/n na norma do máximo. As 
desigualdades |x|y < |x| < |xls < nl|x|y implicam que By C Bs C B C By. 


Diz-se que o conjunto X C R” é limitado quando está contido em alguma bola 
B[a; r]. Como B[a;r] C B[0; k], onde k = r + |a| (conforme veremos agora), 
dizer que X é limitado equivale a dizer que existe k > O tal que |x| < k para todo 
xEX. 

Para mostrar que B[a;r] C B[0;r + |a|], note que |x-al < r = 
|x —a +aļ| < |x -a| + la| <r + jal. 

Assim, x € B[a; r] => x e B[0;r + jal]. 

Uma aplicação f : X —> R” diz-se limitada quando sua imagem f(X) C R” 
é um conjunto limitado, isto é, quando existe c > O tal que | f (x)| < c para todo 
xEX. 

Dados a Æ b em R”, a reta que une esses dois pontos é o conjunto 
ab = { (1 — t)a + tb; t ER). Por sua vez, o segmento de reta de extremos a, b é 
o conjunto [a, b] = { (1 — t)a + tb;O0 <t <1}. 

Um conjunto X C R” chama-se convexo quando o segmento de reta que une 
dois quaisquer de seus pontos está inteiramente contido em X. Noutros termos, 
dizer que X é convexo equivale a afirmar que 


abeX, O0<t<1 > dI-da+tbeX. 


Exemplo 1. Toda bola (aberta ou fechada) é um conjunto convexo. Para fixar 
as idéias, consideremos a bola fechada B = Blxo;r]. Dadas a,b € B, temos 
la — xo| < r e |b — xo| < r. Então, para qualquer t € [0, 1] vale xo = (1 — t)xo + 
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txo, logo 


d-Da+tb-xo) = | —t)a + tb -— (1 — t)xo — txol 
|d — ta — xo) + t (b — xo) | 

(1 — a xo| + t|b = xol 

(d — t)r +tr =r, 


IA 


IA 


< 


Exemplo 2. Seja X = {(x, y) € R?; y < x7}. O conjunto X C R? não é 
convexo. Com efeito os pontos a = (—1, 1) e b = (1,1) pertencem a X mas 


1 1 
2º + 2? = (0,1) não pertence a X. < 


3 Conjuntos abertos 

Sejaa e X C R”. Diz-se que o ponto a é interior ao conjunto X quando, 
para algum r > 0, tem-se B(a;r) C X. Isto significa que todos os pontos 
suficientemente próximos de a também pertencem a X. O conjunto int.X dos 
pontos interiores a X chama-se o interior do conjunto X. Evidentemente, int.X C 
X. Quando a € int. X, diz-se que X é uma vizinhança de a. 


Exemplo 3. Seja X = Re? y) € Rº: y > 0) o semi-plano superior fechado. 
Se p = (a,b) com b > 0, então p € int.X. Com efeito, afirmamos que B = 
B(p;b) C X. Isto é claro geometricamente. 


Figura 3. 
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Em termos mais precisos, argumentamos assim: 


œ, y)EB > V&-a}+0O-b} <b > y-b <b? 
> y —2by+b <b > y <2by > y > 0 (pois b > 0), 


e portanto (x, y) € X. < 


Exemplo 4. Com a notação do Exemplo 3, os pontos da forma q = (a, 0), per- 
tencem a X porém não são interiores a X. Com efeito, nenhuma bola B(g; r) de 
centro q pode estar contida em X pois o ponto (a, —r/2) pertence a B(g; r) mas 
não a X. Segue-se então que int.X = ez WeR?,y> 0). 

Um conjunto A C R” chama-se aberto quando todos os seus pontos são inte- 
riores, isto é, quando A = int.4. < 


Exemplo 5. Toda bola aberta B = B(a; r) é um conjunto aberto. Com efeito, 
sejax € B. Então |x — a| < r, logos = r — |x— a| > 0. Afirmamos que, 
B(x; s) C B. Com efeito, ye B(x; s) > |y — x| < r — |x — a|. Logo 

y EB; s) > ly-al<|y-xl+Ix-al<r—|x—al+Ix—a|=r. 


Daí concluimos que y € B(x; r). < 


Figura 4. 


A fronteira de um conjunto X C R” é o conjunto fr. X formado pelos pontos de 
X que não são interiores a X, juntamente com os pontos de R” — X que não são 
interiores a R” — X. De forma mais simples: tem-se x € fr.X quando toda bola 
de centro x contém pontos de X e pontos de R” — X. 


Exemplo 6. Seja X = [&, y) e R; y> 0), como no Exemplo 3. De forma 
análoga ao argumento usado no Exemplo 3, mostra-se que todo ponto de R? — X = 
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ta, y) € R?; y < 0} é um ponto interior (ou seja, que R? — X é um conjunto 
aberto). Logo, nenhum ponto de R? — X pode estar na fronteira de X. Segue-se 
então do Exemplo 4 que fr.X = { (x, 0); x € R } = eixo dos xx. < 


Teorema 1. (a) Se A, A) são abertos em R” então A, N A, é aberto. 


(b) Se (A;)reL é uma família arbitrária de conjuntos abertos A, C R” então a 
reunião A U A; é um conjunto aberto. 
AEL 
Demonstração. Vide vol. 1, pág. 49. Mesma demonstração, substituindo apenas 
cada intervalo (a — £, a + £) pela bola B (a; £). 

Resulta imediatamente do Teorema 1 que a interseção A = A; N -+-+ N Ay de 
um número finito de conjuntos abertos A,,..., Ay é ainda um conjunto aberto. 
Entretanto, a interseção de infinitos abertos pode não ser aberta, como mostra o 

(0,0) 
exemplo (7 B(a; 1/k) = (a). 


k=1 
Seja X C R”. Diz-se que um subconjunto A C X é aberto em X quando cada 


ponto a € A é centro de uma bola aberta B(a; r), tal que B(a;r)NX C A. Isto 
significa que os pontos de X que estão suficientemente próximos de cada a € A 
pertencem a A. A reunião U de todas essas bolas é um aberto tal que A = U N X. 
A recíproca é óbvia, de modo que um conjunto 4 C X é aberto em X se, e somente 
se, A = U N X onde U é aberto em R”. 

Por exemplo, o intervalo (0, 1] é aberto em [0, 1] pois (0, 1] = (0, 2) N [Ọ, 1]. 


4 Seqüências em R” 


Uma seqüência em R” é uma função f : N —> R”, que associa a cada número 
natural k um ponto x, € R”. As notações para uma segiiência são (x1, .. . , Xp,...), 
(xk)ken ou simplesmente (xy). 

Para cada i = 1,...,n, indicamos com xx; a i-ésima coordenada de x,. Assim, 
Xk = (Xk1, Xk2, ---» Xkn). Dar uma sequência em R” equivale a dar as n sequências 
de números reais (Xp )keN, -..» (Xkn)keN- 

Diz-se que a segiiência (xy )keN é limitada quando existe uma bola em R” que 
contém todos os termos x+. Isto equivale a dizer que existe c > O tal que |x| < c 
para todo k € N. Em virtude das desigualdades que relacionam as três normas que 
consideramos em R”, ser limitada é uma propriedade da segiiência que independe 
de qual dessas três normas estamos tratando. 

Se a segiiência (xp) é limitada então, para todo i = 1,...,n, a sequência 
(Xri)keN das i-ésimas coordenadas de x, é também limitada, pois |xk;| < |xy|. 
Vale também a recíproca. Para prová-la, adotaremos em R” a norma do máximo. 
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Então, se |xu| < c1, Ixp| < c2, ..., |Xkn| < cn para todo k e N, chamando de c o 
maior dos números cy, c2,..., cn teremos |x| = max(|xw|,..., |xwn|) < c para 
todo k € N. Assim, se cada (Xk;)ken(i = 1,...,n) é limitada, a segiiência (x;)keN 


é limitada. 

Uma subsegiiência de (xy)keN é a restrição desta sequência a um subconjunto 
infinito Nº = {k1 < -+> < km < ...} C N. As notações (Xen, (Xk, )JmeN OU 
(Xkis +++» Xk» --- ) São usadas para indicar uma subsegiiência. 

Diz-se que o ponto a e R” é o limite da segiiência (x) quando, para todo € > O 
dado arbitrariamente, é possível obter ko e N tal que k > k > |x- aļ < e. 


Noutras palavras: k > ko > x, € B(a; £). Escreve-se então lim x, = a, 
k-—> 00 


= xp = a ou lim x, = a, simplesmente. 
É De acordo com esta definição, tem-se limx, = a se, e somente se, 
lim |x; — a| = 0. 

Dizer que lim x, = a significa afirmar que qualquer bola de centro a contém 
todos os x com a possível exceção de um número finito de valores de k (que são 
1,2,...,k0). 

Uma seqiiência (x) em R” diz-se convergente quando existe a = lim xp. Da 
observação acima resulta que toda seqüência convergente é limitada. É também 
óbvio que qualquer subsegiiência de uma segiiência convergente é também con- 
vergente e tem o mesmo limite. 

Observe-se ainda que a definição de limite faz uso de uma norma, porém as 
desigualdades |x|y < |x] < Ixlg <n-|x|y mostram que a existência e o valor 
do limite não depende de qual das três normas usuais se está considerando. Este 
fato será empregado na demonstração do teorema abaixo, onde no final usamos a 
norma do máximo. 


Teorema 2. A segiiência (xy) em R” converge para o ponto a = (a,...,an)se, e 
somente se, para cadai = 1,...,n, tem-se lim xy; = as, isto é, cada coordenada 
k—> 00 


de x; converge para a coordenada correspondente de a. 


Demonstração. Para cada i = 1,...,n, tem-se |xp — a;| < |x — al, portanto 

limxp = a > Jim Xki = a;i. Reciprocamente, se vale esta última igualdade 
—> 00 

então, dado £ > 0, existem k,,...,k, € N tais que k > k > Ixi—a;| < 

e(i = 1,...,n). Tomando k = max(k,,...,k,) e adotando em R” a norma do 


máximo, vemos que k > ko > |x — a| < £. Logo lim x, = a. 


Corolário 1. Selimx, = a, limy, = b em R” e lim œ; = « em R então lim (x; + 
yz) =a + b e lim gx = qa. 


Tomando cada seqüência de coordenadas, o corolário resulta da propriedade 
correspondente em R. 
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Além disso, lim( xp, yk} = (a, b), como se vê facilmente. E a desigualdade 
Ilx] — lal| < |y — a| mostra ainda que se tem lim |x,.| = |a| seja qual for a norma 
adotada. 


Teorema 3 (Bolzano-Weierstrass). Toda segiiência limitada em R" possui uma 
subsegiiência convergente. 


Demonstração. Seja (xp) uma sequência limitada em R”. As primeiras coordena- 

das dos seus termos formam uma segiiência limitada (x, )+eN de números reais, 

a qual, pelo Teorema de Bolzano-Weierstrass na reta (vol. 1, pág. 25), possui 

uma subsegiiência convergente. Isto é, existem um subconjunto infinito N; C N 

e um número real a, tais que ma xy = q. Por sua vez, a segiiência limitada 
eN; 


(xk)keNn; em R possui uma subseqüência convergente: existem um subconjun- 
to infinito N2 C N; e um número real a, tais que lim xx, = a. E assim por 


keN2 
diante, até obtermos n conjuntos infinitos N > Ny D N2 D --- D N, e núme- 
ros reais 41, A2, ..., An tais que lim xg; = a; para i = 1,2,...,n. Então pomos 
keN; 
a = (ai, .. . , an) e, pelo Teorema 1, temos lim x, = a, o que prova o teorema. 


keN, 


Uma seqiiência de pontos x; € R” chama-se uma segiiência de Cauchy quando, 
para todo £ > 0 dado, existe k € N tal que k, r > ko > |xk — x,| < €. 

Toda seqüência de Cauchy (xx) é limitada. Com efeito, tomando £ = 1 na defi- 
nição acima, vemos que existe um índice kọ tal que, salvo possivelmente os pontos 
X1, . - - , Xko todos os demais termos x; pertencem à bola B(xkọ+1; 1). Portanto o 
conjunto dos termos da seqüência é limitado. 

A condição para que a seqüência (xy) seja de Cauchy pode ser reformulada 


dizendo-se que lim |xk — x,| = O, isto é, que lim |x — x,| = O. Daí resulta 
kir> 00 k,reN 


que se Nº C N é um subconjunto infinito, ou seja, se (x-)-en' é uma subseqüência 


de (x,) então lim |x — x| = 0. 
keN,reN' 


Teorema 4 (Critério de Cauchy). Uma segiiencia em R” converge se, e somente 
se, é uma segiiência de Cauchy. 


Demonstração. Seja (x) uma segiiência de Cauchy em R”. Sendo limitada, 


ela possui uma subsegiiência convergente (x,),en. Seja a = limx,. Temos 
reN 

lim |x, —a| = 0e lim |x;—x,| = 0, como observamos acima. Então, de 

reN keN,reN 


|x — a| < |x — x,| + |x- — a| resulta que lim |x, — a| = 0, ou seja, lim x, = a. 
keN k- 00 


Reciprocamente, se (x) é convergente, com lim x, = a, então, como |xy — x,| < 


|x — a| + |x, — a|, concluímos que Jim |x — X,| = 0, ou seja, (x) é de Cau- 
;r> 00 


chy. 
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5 Conjuntos fechados 


Diz-se que o ponto a é aderente ao conjunto X C R” quando existe uma segiiência 
de pontos x, € X tais que lim x, = a. 

Chama-se fecho do conjunto X C R” ao conjunto X formado por todos os 
pontos aderentes a X. Portanto a € X + a = lim xz, x € X. Dizer que a € X é 
o mesmo que afirmar que a é aderente a X. 

Um conjunto F € R” chama-se fechado quando F = F, isto é, quando o limite 
de toda seqüência convergente de pontos de F é ainda um ponto de F. 

Todo ponto x € X é aderente a X pois é limite da seqüência constante 
(x,x,...). Assim, X C X qualquer que seja X C R”. Também é óbvio que 
XCY>XCY. 


Exemplo 7. Se |x| = r então x não pertence à bola aberta B = B(0; r) porém 
1 
é aderente a ela. Com efeito, pondo x, = (1 = E para todo k e N, temos 


xg E€ B(0; r) e lim x = x, logo x € B. 

Reciprocamente, se x € B então x = lim yg com |x| < r para todo k e N, 
portanto |x| = lim |x| < r. Conclui-se então que x € B & |x| <r, ou seja, 
B = B[0; r]. O mesmo argumento mostra que o fecho de toda bola aberta B (a; r) 
é a bola fechada Bla; r]. < 


O teorema abaixo resume as principais propriedades do fecho de um conjunto. 


Teorema 5. (a) O ponto a é aderente ao conjunto X C R" se, e somente se, 
toda bola de centro a contém algum ponto de X. 


(b) Um conjunto F C R” é fechado se, e somente se, seu complementar R” — F 
é aberto. Equivalentemente: A C R" é aberto se, e somente se, R" — A é 
fechado. 


(c) O fecho de qualquer conjunto X C R" é fechado. Noutras palavras: para 
todo X CR" tem-se X = X. 


Demonstração. (a) Se a é aderente a X então a = lim xg, com x, € X para todo 
k e N. Portanto qualquer bola B(a; r) contém pontos de X, a saber, todos os xg 
com k suficientemente grande. Reciprocamente, se toda bola de centro a contém 
pontos de X, podemos escolher, para cada k e N, um ponto x, € X que esteja na 
bola B(a; 1/k), isto é, |x — a| < 1/k. Então lim x, = a, logo a é aderente a X. 

(b) As seguintes afirmações são equivalentes: (1) F é fechado. (2) Se x € 
R” — F então x não é aderente a F. (3) Sex € R” — F então existe r > 0 tal que 
B(x;r) C R” — F (em virtude da parte (a) acima). (4) R” — F é aberto. Assim, 
F fechado & R” — F aberto. 
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Escrevendo A = R” — F, donde F = R” — A, esta última conclusão lê-se 
assim: A é aberto se, e somente se, R” — A é fechado. 

(c) Sex e R” — X (isto é, x não é aderente a X) então, por (a), existe uma 
bola B = B(x;r) que não contém pontos de X, ou seja, X C R” — B. Logo 
X c R” — B. Mas, pela parte (b) acima, R” — B é fechado; portanto X c R” — B 
ou, equivalentemente, B C R” — X. Assim, todo ponto x € R” — X é um ponto 
interior e R” — X é aberto. Segue-se que X é fechado. 


Alguns conjuntos X C R” não são abertos nem fechados, como X = B (a; r) U 
{b}, onde |b — a| = r. Ou então X = conjunto dos pontos de R” com coordenadas 
racionais (X = Q”). 

Chama-se distância do ponto a € R” ao conjunto X C R” ao número 


d(a; X) = inf. {|x —-a|;xEe X}. 


Pela definição de ínfimo, para cada k e N existe um ponto x, e X talque d (a; X) < 
1 ; : 
|xx— a| < d(a, X) + r portanto Jim |x — a| = d(a; X). A segiiência (xz) é 
—> 00 
certamente limitada, portanto possui uma subsegiiência convergente. Descartando 
(por serem desnecessários) os termos x; que não estejam nessa subsegiiência, 
vemos que existe um ponto xy = lim x, tal que d(x, X) = |xo — a]. Tem-se 
xo E€ X. Se o conjunto X for fechado então xo e X. Podemos então enunciar o 


Teorema 6. Seja F C R” um conjunto fechado. Dado qualquer a e R” existe 
(pelo menos um) xo € F tal que |xy— a| < |x — al para todo x E F. 


Noutras palavras: se F C R” é fechado então, para a e R” qualquer, a função 
f: FE — R dada por f(x) = |x — a| assume seu valor mínimo em algum ponto 
xo € F. Então tem-se d(a, F) = |xo — al. 

Se X c Y c R’, diz-se que X é denso em Y quando X = Y. Por exemplo, 
B(a; r) é denso em Bla; r] e Q” é denso em R”. 

Dizemos que a € R” é ponto de acumulação do conjunto X C R” quando 
toda bola de centro a contém algum ponto de X diferente de a. (Noutras palavras, 
quando a € X — {a}.) Um ponto de acumulação de X pode pertencer a X ou não. 
Sea € X não é ponto de acumulação de X, diz-se que a é um ponto isolado de X. 
Isto significa que existe r > 0 tal que B(a; r)N X = {a}. Quando todos os pontos 
de X são isolados, dizemos que X é um conjunto discreto. 


Exemplo 8. Todos os pontos de uma bola são pontos de acumulação. O conjunto 
Z” dos pontos de R” com coordenadas inteiras é um conjunto discreto. < 


As demonstrações dos três teoremas seguintes são omitidas pois são pratica- 
mente as mesmas dos seus análogos unidimensionais, provados no volume 1 (págs. 
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50, 52 e 53). Basta substituir cada intervalo (a — r,a + r) pela bola B(a;r) e 
considerar |x| como a norma de x. 


Teorema 7. Sejam a um ponto e X um subconjunto de R". As seguintes afirmações 
são equivalentes: 


(1) a é um ponto de acumulação de X. 
(2) a é limite de uma segiiência de pontos x, e X — {a}. 
(3) Toda bola de centro a contém uma infinidade de pontos de X. 


Teorema 8. Todo subconjunto infinito limitado X C R” admite pelo menos um 
ponto de acumulação. 


Teorema 9. (a) Se F; e F são subconjuntos fechados de R” então FU F é 
também fechado. 


(b) Se (Fez é uma família arbitrária de conjuntos fechados então a interseção 
F = (1 F, é um conjunto fechado. 
AEL 

Cabe aqui a observação de que (a) implica que a reunião F; U »-- U F, de um 
número finito de conjuntos fechados é ainda um conjunto fechado. Entretanto isto 
não vale para reuniões infinitas. Com efeito, um conjunto qualquer, fechado ou 
não, é a reunião dos seus pontos, que são conjuntos fechados. 

Segue-se do item (2) do Teorema 7 que o fecho do conjunto X é formado 
acrescentando-lhe seus pontos de acumulação que por ventura não pertençam a X. 

Seja X C R”. Diz-se que um subconjunto F C X é fechado em X quando F 
contém todos os seus pontos aderentes que pertencem a X. Assim, F é fechado 
em X se, e somente se, F = FN X. F éfechado em X quando, e somente quando, 
F = GN X onde G C R” é fechado. 

Com efeito se F = GN X com G fechado então F C G, logo F= FNXC 
FAX cC GAX =F, donde F = F N X e F é fechado em X. 

O conjunto F C X é fechado em X se, e somente se, X — F (seu complementar 
relativamente a X) é aberto em X. Com efeito F = GAX & X-F = 
(R” — G) N X, onde G C R” é fechado se, e somente se, R” — G é aberto. 

Analogamente, A C X é aberto em X se, e somente se, X — A é fechado em X 
pois A=UNX & X—A=(R”—U)NXeU c R” é aberto se, e somente se, 
R” — U é fechado. 


6 Conjuntos compactos 


Um conjunto X C R” chama-se compacto quando é limitado e fechado. 
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Exemplo 9. Toda bola fechada B[a; r] é compacta e nenhuma bola aberta é. O 
conjunto Z” é fechado mas não é limitado, logo não é compacto. Toda esfera 
Sla; r] é compacta. < 


Teorema 10. As seguintes afirmações sobre o conjunto K C R” são equivalentes: 
(1) K é compacto; 


(2) Toda seqüência de pontos x, € K possui uma subsegiiência que converge 
para um ponto de K. 


Demonstração. Se K é compacto então toda sequência de pontos x, e K é li- 
mitada, pois K é limitado. Por Bolzano-Weierstrass, uma subsegiiência (xj)keN' 


converge para um ponto a = lim xg. Como K é fechado, tem-se a € K. Logo (1) 
keN' 


implica (2). Reciprocamente, se vale (2) então K é limitado pois do contrário exis- 
tiria, para cada k e N um ponto x, e K tal que |x;| > k. A segiência (xy) assim 
obtida não possuiria subseqüência limitada logo nenhuma de suas subsegiiências 
seria convergente. Além disso, K é fechado pois se a = lim x, com x, € K para 
todo k € N então, por (2) uma subsegiiência de (x; ) convergiria para um ponto de 
K. Mas toda subsegiiência de (x;) converge para a. Logo a € K. Isto mostra que 
(2) = (1) e completa a demonstração. 


Estendendo a discussão da seção 5, dados os conjuntos X, Y C R”, podemos 
definir a distância entre eles pondo 


d(X, Y) =inf.(lx—-y|xe X,yeY), 


cabendo-nos agora indagar se, supondo X e Y fechados, existem xo € Xe yo € Y 
tais que d(X,Y) = |xo — yol. Nem sempre. Com efeito, tomando em R°? o 
conjunto X como sendo o eixo das abcissas, isto é, X = ((x,0);x E R}e Y = 
f(x, 1/x); x > 0), ou seja, Y = ramo positivo da hipérbole y = 1/x, vemos que X 
e Y são subconjuntos fechados disjuntos em R? tais que d(X, Y) = 0. Entretanto, 
vale o seguinte resultado, que contém o Teorema 5 como caso particular: 


Teorema 11. Sejam K C R” compacto e F C R” fechado. Existem x) € K e 
yo E F tais que |xo— yo| < |x — y| para quaisquerx e Key E F. 


Demonstração. Da definição de ínfimo segue-se que existem seqüências de pontos 
xk E€ Key E€ F tais que d (K, F) = lim |xk — y|. Passando a uma subseqüência, 
se necessário, a compacidade de K nos permite admitir que lim x, = xo E€ K. 
Além disso a sequência (y+) é limitada pois | y| < |y — xk| + |xzl, onde |y — xl 
é limitada por ser convergente e |x| é limitada pois x, € K. Logo, passando 
novamente a uma subseqüência, se necessário, podemos admitir que lim y = yo, 
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com yo € F pois F é fechado. Então |xo — yol = lim |xk — yl = d(K, F) < 
|x — y| para quaisquer x e Key e F. 


Corolário 2. Sejam K CU C R”, onde K é compacto e U é aberto. Existe > O 
tal que toda bola B(x; £), com raio £ e centro num ponto x € K, está contida 
em U. 


Com efeito, sejam xy) € K e yọ € F = R” — U tais que |xo — yo] < |x — y| 
para quaisquer x € K e y e F. Ponhamos € = |xo — yo). Como K C U, vemos 
que K N F = Ø, portanto xo £ yo e daí € > 0. Assim, se x € K e y É U, tem-se 
|x — y| > £. Noutras palavras, se x € K então B(x; £) CU. 

Se Fi D F2 D--- D Fk D ... é uma seqüência decrescente de fechados não- 

[0,0] 


vazios em R”, pode ocorrer que (7) F = Ø. Isto ocorre, por exemplo, quando 
k=1 
tomamos F, = [k, +00) em R. O teorema abaixo mostra que isto não acontece 


quando um dos Fx é limitado (portanto todos os seguintes são). 


Teorema 12 (Cantor). Seja Kı D K)D---D Kg D ... uma segiiência decres- 


cente de compactos não-vazios em R". Existe pelo menos um ponto a € R” que 
OO 


pertence a todos os Ky. Noutros termos: () Ky £ 2. 
k=1 
Demonstração. Paracadak e N, escolhamos um ponto x, € Ky. A sequência (x) 
é limitada, logo possui uma subseqüência (x,),eN', que converge para a = lim Xp. 
reN' 


Mostremos que a € K+ para todo k € N. De fato, dado k, temos K, C Ky sempre 


quer € N'er > k. Assim,r eN',r > k > x, € K,. Segue-se que a = lim x, 
reN' 


pertence ao conjunto fechado Kz. 


Uma propriedade fundamental dos conjuntos compactos é o fato de que toda 
cobertura aberta de um compacto possui uma subcobertura finita. Vejamos isto. 


Uma cobertura do conjunto X C R” é uma família (C,),ez de subconjuntos 


C, C R” tais que X C (U C. Isto significa que para cada x € X existe um A € L 
xeL 
tal que x € C}. 


Uma subcobertura é uma subfamília (C;)rer» L’ C L, tal que ainda se tem 
Xc UG. 


AEL’ 
Diz-se que a cobertura X C UC; é aberta quando os C, forem todos abertos, 


ou finita quando L é um conjunto finito. 


Teorema 13 (Borel-Lebesgue). Toda cobertura aberta K C UA; de um compac- 
to K C R” admite uma subcobertura finita K C Ay, U---U As. 
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Inicialmente, prepararemos o terreno para estabelecer um lema que torna a 
demonstração do teorema quase imediata. 
Seja X C R” um conjunto limitado. O diâmetro de X é o número 


diam. X = sup {|x — yl; x,y E X}. 


Segue-se imediatamente desta definição que se diam. X = d ex e X então 
X c B[x;d]. 
n 
Dado a > 0, um cubo de aresta œ é um produto cartesiano C = | [[a;, a; +a] 
i=1 
de n intervalos de comprimento q. Sex = (X1,..., Xn) € Y = (D1,...,)n) 
pertencem a C então, para cada i = 1,...,n,tem-se |x; — y;| < a logo |x — y| = 
VL(x; — yi)? < y/n. Tomando y; = a; + a temos |x — y| = y/n, portanto 


w/n é o diâmetro do cubo de aresta œ em R”. 


A decomposição R = | [me, (m + 1)a] da reta em intervalos adjacentes 
de comprimento «œ detento quina decomposição de R” como reunião de cubos 
adjacentes de aresta œ. A saber, para cada m = (m,,...,m,) E€ Z”, pomos 
Cs [lia (m; + 1)a] e temos R” = U) Cy. 

do X C R” tem-se X = IJ Gn Cm). Se X é limitado apenas um 

mez" 


número finito das interseções X N Cm são não-vazias, logo podemos escrever 
X=>XU-cUX, 


onde cada X; é da forma X N Cnm, logo tem diâmetro < «/m. Se X for compacto 
então cada X; é compacto. Isto prova o 


Lema 1. Seja K C R” compacto. Para todo € > O existe uma decomposição 
K = Kı U --- U Kg onde cada K; é compacto e tem diâmetro < e. 


Demonstração do Teorema de Borel-Lebesgue. Seja K C R” compacto. Supo- 
nhamos, por absurdo, que K C UA, seja uma cobertura aberta que não admite 
subcobertura finita. Exprimamos K como reunião finita de compactos, todos com 
diâmetro < 1. Pelo menos um deles, que chamaremos K4, é tal que Kı C UA, 
não admite subcobertura finita. Escrevendo Kı como reunião finita de compactos 
de diâmetro < 1/2, vemos que pelo menos um deles, digamos K2, não pode ser 
coberto por um número finito de A/s. Prosseguindo assim, obtemos uma seqüên- 
cia decrescente de compactos Kı D K2 D -+> D Kk D ... com dam K; < 1/k 


e tal que nenhum deles está contido numa reunião finita de A s. Em particular, 
OO 

todos os Ky são não-vazios. Pelo Teorema 12, existe a e () Ky. Para algum À, 
k=1 
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tem-se a € A}. Como A; é aberto, tem-se B(a; 1/k) C A, para algum k. Sendo 
a e K; e diam K; < 1/k, concluímos que Ką C B(a; 1/k), donde K; C A}, O 
que é uma contradição. 


7 Aplicações contínuas 


Uma aplicação f: X —> R”, definida no conjunto X C R”, associa a ca- 


da ponto x e X sua imagem f(x) = (fi(x),..., fa(x)). As funções reais 
fis---, fa: X > R, assim definidas, chamam-se as funções-coordenada de f. 
Escreve-se então f = (fi... fu). 


Se Y C R” étal que f(X) C Y podemos (com um abuso de notação que é 
irrelevante em nosso contexto) escrever f : X > Y em vez de f : X —> R”. 

Diz-se que f é contínua no ponto a € X quando, para cada € > O arbitraria- 
mente dado, pode-se obter ô > 0 tal que 


xeX, x-a] <ê > |fœ&)-— fla)|<e. 


Noutros termos: para cada bola B( f(a); €) dada, existe uma bola B(a; ô) tal que 
f(B(a; 8) N X) C B(f (a); £). 
A continuidade de f no ponto a independe das normas que se utilizem em R” 
e R”. 
Diremos que f : X —> R” é uma aplicação contínua no conjunto X C R” 
quando f é contínua em todos os pontos a € X. 


Teorema 14. Sejam X C R”, Y C R", f: X SR com f(X) CYe 
g: Y > RP. Se f é contínua no pontoa e X e g é contínua no ponto f(a) 
então go f: X —> R? é contínua no ponto a. Ou seja: a composta de duas 
aplicações contínuas é contínua. 


Demonstração. Seja dado € > 0. A continuidade de g no ponto f(a) assegura a 
existência de à > 0 tal que y € Y, |y — f (a)| < à > |e(y)— (f (a))| < £. Por 
sua vez, dado À > 0, a continuidade de f no ponto a fornece ô > 0 tal que x € X, 
|x —a| < ê => |f œ) -— f(a)] <à => Ig(f0))—g(f(a)| < e£, logogofé 
contínua no ponto a. 


Teorema 15. (a) A aplicação f : X —> R” é contínua no pontoa € X se, e 
somente se, para toda segiiência de pontos x, € X com lim x, = a, tem-se 


lim fœ) = f(a). 


(b) A aplicação f : X —> R” é contínua no ponto a E X se, e somente se, suas 
funções-coordenada fi, ..., fa: X — R são contínuas nesse ponto. 


SECTION 7: APLICAÇÕES CONTÍNUAS 19 


Demonstração. (a) Seja f: X —> R” contínua no ponto a. Dada a segiiên- 
cia de pontos x, E€ X com limx, = a, para todo € > O existe ô > O tal 
que f(B(a;6)) C B(f(a);e). Correspondente a ô, existe k € N tal que 
k > ko > xg € B(a; 6), logo k > ko > f(x) € B(f (a); €). Isto mostra que 
lim f(x) = f(a). Reciprocamente, suponhamos por absurdo, que lim x, = a 
implique lim f (xx) = f(a), porém f seja descontínua no ponto a. Então existe 
€ > 0 com a seguinte propriedade: para todo k e N, podemos encontrar x, e X 
com |x — a| < 1/k e |f(x;) — f(a)| > e. Assim, temos lim x, = a mas não 
temos lim f(x;) = f (a), uma contradição. 

(b) Isto decorre imediatamente do Teorema 2 junto com a parte (a), que aca- 
bamos de provar. 


Teorema 16. Seja X CR”. Se as aplicações f, g : X — R" e a: X — R são 
contínuas no ponto a € X então são também contínuas nesse ponto as aplicações 
f+8:X > R", (f,8): X — R, |f|: X > Reaf:X > R", definidas 
por (f +890) = fœ) +8), (CÍ g)0) = (fE), 800), IFI = Ifl e 
(a f)(0) = alx) - f(x). 


Demonstração. Isto resulta do Teorema 15(a) juntamente com o Corolário do 
Teorema 2. 


Teorema 17. A imagem f(K) do conjunto compacto K C X pela aplicação 
contínua f : X —> R” é também um conjunto compacto. 


Demonstração. Seja (yk) uma sequência de pontos em f(K). Para cada k e N 

existe x, € K talque f(x) = yg. Como K é compacto, uma subsegiiência (xj)keN' 

converge para um ponto a e K. Sendo f contínua nesse ponto a, de lim xk=a 
keN' 


resulta, pelo Teorema 15, que lim f(x) = f(a). Logo toda seqüência de pontos 
é 1 


Yk = f(x) E€ f (K) possui uma subseqüência (yz)zken’ convergente para um ponto 
f(a) e f(K). Noutras palavras: f (K) é compacto. 


Corolário 3 (Weierstrass). Seja K C R” compacto. Se f: K > R é uma 
função real contínua, então existem xo, xı € K tais que f (xo) < f(x) < f (xı) 
para todo x € K. 


Noutras palavras: toda função real contínua num conjunto compacto K atinge 
seus valores mínimo e máximo em pontos de K. 

Para provar o Teorema de Weierstrass basta observar que, sendo f(K) C R 
compacto, os números yo = inf f (K) e yı = sup f (K) pertencem a f (K), isto é, 
Yo = f (xo) e yı = f (xı), com xo, x, E K. 
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Teorema 18. Seja X C R”. A aplicação f: X —> R" é contínua se, e somente 
se, a imagem inversa fT!(A) de todo conjunto aberto A C R” é um subconjunto 
aberto em X. 


Demonstração. Seja f contínua. Se A C R” é aberto então, para todo x e fT!(A) 
existe £ > O tal que B(f(x); £) C A. Pela continuidade de f, x é centro de uma 
bola aberta B, talque f (B,N X) C B(f (x); £) C A, logox e BAX Cf (A). 
Isto valendo para todo x e fT!(A), resulta que fH(A) C UN X c f(A), 
logo fT!(A) = U N X, onde U é a reunião das bolas abertas B,, x € TEMA 
Reciprocamente, suponhamos que, para todo aberto A C R”, f-!(A) seja aberto 
em X, isto é, f(A) = U N X com U aberto em R”. Então, dado x € X e 
e > 0, tomamos A = B(f (x); €) e obtemos U C R” aberto tal que U N X = 
f'(B(f(x);£)). Certamente x € U, logo existe ô > 0 tal que B(x; ô) C U e 
assim f (B(x; ô) N X) C B(f(x); €). Portanto, f é contínua em todos os pontos 
xex. 


Teorema 19. Seja X C R”. A aplicação f : X —> R” é contínua se, e somente 


se, a imagem inversa de todo conjunto fechado F C R” é um subconjunto f'(F) 
fechado em X. 


Demonstração. Isto resulta do Teorema 18 se observarmos que, pondo A = Rº — F 
então A é aberto em R” e que fT! (F) = X— f7! (A) é fechado em X se, e somente 
se, fT! (A) é aberto em X. 


Observação. Dada f : X > R”, se f(X) CY cC R” podemos considerar f 
como uma aplicação de X em Y e escrever f : X —> Y. Se A e F são subconjuntos 
de R” então fT!(A) = f (ANY e fTI(F) = fTI(F N Y). Logo podemos 
enunciar os Teoremas 18 e 19 assim: A aplicação f : X —> Y é contínua se, e 
somente se, a imagem inversa por f de todo subconjunto aberto (respect. fechado) 
em Y é um subconjunto aberto (respect. fechado) em X. 


Corolário 4. Seja X C R” aberto (respect. fechado). A fim de que f : X > 
R” seja contínua é necessário e suficiente que a imagem inversa por f de todo 
subconjunto aberto (respect. fechado) em R" seja um conjunto aberto (respect. 
fechado) em R”. 


Corolário 5. Sejam f, g : X > R contínuas no conjunto X C R”. O conjunto 
A = {x € X; f(x) < g(x)) é aberto em X enquanto os conjuntos F = {x € 
X; fŒ) < g(x)} e G = {x € X; f(x) = g(x)} são fechados em X. 


Em particular, tomando g constante, vemos que o conjunto dos pontos x € X 
tais que f(x) < c é aberto em X enquanto as soluções x € X da inequação 
f(x) < c ou da equação f(x) = c formam conjuntos fechados em X. 
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Teorema 20. Sejam py: K > R” continua no compacto K C R” e L = ọ(K)a 
imagem (compacta) de q. A fim de que uma aplicação f : L > R? seja contínua, 
é necessário e suficiente que a composta f o : K —> R? seja contínua. 


g., p 


L 
Demonstração. Se f é contínua então f o qy é contínua, pelo Teorema 14. Reci- 
procamente, supondo f oq contínua então, para todo conjunto fechado F C R”, a 
imagem inversa (f og)! (F) = q !f”!(F)] é um subconjunto fechado de K, lo- 
go é compacto. Então, pelo Teorema 17, f7! (F) = olp (f7! (F))] é compacto, 
logo fechado em R”. Segue-se do corolário acima que f é contínua. 


Observação. Quando se tem uma aplicação arbitrária py: K —> L entre dois 
conjuntos, para todo Z C L vale a inclusão olo (z)] C Z. Entretanto, quando 
pq: K — L é sobrejetiva, como no caso acima, tem-se e[l (z)] A. 


Exemplo 10. Tomemos K = [0,27] C R, L = S! = {(x, y) € RZ; x? + y? = 
1} e q: [0,27] — R? dada por p(t) = (cost, sent). Então [0,27] e S! são 
compactos e q : [0,27] > S! é contínua e sobrejetiva. Seja agora g : [0,27] —> 
R” uma aplicação contínua tal que g(0) = g(27). A partir de g, podemos definir 
f: S! — R”, pondo f(cost, sent) = g(t). Como g(0) = g(27), f está bem 
definida. Além disso, f o qy = g é contínua. Segue-se do Teorema 20 que f é 
contínua. Isto se exprime dizendo que “para definir uma aplicação contínua no 
círculo S! basta defini-la no intervalo [0, 27] de modo que assuma valores iguais 
nos extremos 0 e 27.” < 


8 Continuidade uniforme 


A adição e a multiplicação de números reais são funções contínuas s, p : R? > R, 
definidas por s(x, y) = x + y e p(x, y) = x - y. Examinemos a continuidade 
de cada uma delas no ponto (a, b) € R?. Para isso, usaremos em R? a norma do 
máximo, segundo a qual tem-se (x, y) e B((a, b); 6) se, e somente se, |x — a| < ô 
ely—b| < ô. 

Comecemos com a adição: dado € > 0, tomemos ô = a/2. Se |x — al < 
€/2 e |y— b| < £€/2, isto é, (x, y) € B((a, b), ô), então |s(x, y) — s(a, b)| = 
lx +y — (a +b)| < |x — a| + |y — b| < e. 
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Em seguida, a multiplicação: dado € > 0, temos xy — ab = (x — a)(y — 
b) + (x — a)b + a(y — b), logo, tomando ô > O menor do que cada um dos 


números —./£, veremos que se |x — a| < de ly—b| < ô isto é, 


E 
e 
3 3lal 3Ibl 
(x, y) € B((a, b), 6), então 


Ip(x,y)— pla, b)| = |xy —ab| < |x-ally—b|+I|x -— al] |b| + lal |y — bl 


Sea á +z =E. 

Note-se a diferença: no caso da adição, ô depende apenas de £, mas não do ponto 
(a, b) onde a continuidade é testada. Já na multiplicação, ô depende não apenas 
de £ mas também de (a, b). Se um dos números a ou b aumentar, para o mesmo 
e deve-se tomar ô cada vez menor. Isto significa que a adição é uniformemente 
contínua mas a multiplicação não é. Segue-se a definição pertinente: 

Uma aplicação f : X —> R” diz-se uniformemente contínua no conjunto X C 
R” quando, para todo € > 0, for possível obter ô > O tal que |x — y| < 6 = 


If œ) — f()| < £, sejam quais forem x,y € X. 


Teorema 21. A fim de que f : X > R” seja uniformemente contínua no conjunto 
X C R” é necessário e suficiente que, para toda segiiência de pontos xp, yk E X 
com lim |x; — y| = 0, se tenha lim | f(x) — f Opl = 0. 


Teorema 22. Toda aplicação contínua f : X —> R”, definida num conjunto com- 
pacto X C R”, é uniformemente contínua. 


As demonstrações dos Teoremas 21 e 22 são exatamente as mesmas que se 
encontram nas páginas 83 e 84 do volume 1. 


Exemplo 11. Uma aplicação f : X —> R”, definida no conjunto X C R”, chama- 
se lipschitziana quando existe c > O tal que |f(x) — f(y)| < clx — y| para 
quaisquer x,y E€ X. O número c é chamado uma constante de Lipschitz de f. 
Toda aplicação lipschitziana é uniformemente contínua: dado £ > 0, basta tomar 
ô = e/c. A função f : [0,1] > R, definida por f(x) = ~x, é uniformemente 
contínua mas não é lipschitziana. Basta ver que 


IVx — vyl = 


1 
FID” 


e que, com x, y € [0, 1] pode-se tornar /x + „/y tão pequeno, (logo (,/x + D! 
tão grande) quanto se queira. < 
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Exemplo 12. Toda transformação linear A : R” — R” é contínua pois, para 
cada i = 1,2,...,n, a i-ésima função-coordenada de A é a função contínua 
(X1,...5Xn) © ax +: + dinXn, onde [a;;] é a matriz de A. A esfera unitária 
sr = {x € R”; |x| = 1) é compacta. Logo A é limitada em S"-!. O número 


|A] = sup {|A - x|; x es!) 


chama-se a norma da transformação A. Para todo vetor v € R”, tem-se |A - v| < 
|A| - |v]. Isto é óbvio quando v = 0. Se v Æ O então v/|v| € S”! logo 
v 
|A -v| = [v] - [A { = } | < IA] lvl. 
[vl 
Para x,y € R” quaisquer, tem-se |A -x — Ay| = |A(x — y)| < |A| - |x — yl. 


Logo a transformação linear A é uma aplicação lipschitziana, com constante de 
Lipschitz |A]. < 


Exemplo 13. Dado A C R” não-vazio, seja f : R” —> R definida por f(x) = 
d(x, A). Afirmamos que |d (x, A) — d (y, A)| < |x — y| para quaisquer x, y € R”. 
Logo f é lipschitziana, com constante c = 1, donde uniformemente contínua. Para 
provar nossa afirmação, observemos que, dados x, y € R”, existem a, b € A tais 
que d(x, A) = |x — a| e d(y, A) = |y — b|. (Vide seção 5.) 

Temos b = lim yg, com yg € A. Como |x—a| < |y — y| para todo k € 
N, segue-se que |x — a| < |x — bl. Conseqüentemente, |d (x, A) — d (y, a)| = 
Ilx —aļ— |y — bl|<l|lx—b|- ly — b|| < |x, y|, como queríamos mostrar. 

Quando | f(x) — f (y)| < |x — y| para quaisquer x, y € X, a aplicação lipschit- 
ziana f : X — R” chama-se uma contração fraca. Se | f (x) — f(y)| < c|x — y| 
com 0 < c < 1, a aplicação f chama-se uma contração, simplesmente. < 


9 Homeomorfismos 


Um homeomorfismo do conjunto X C R” sobre um conjunto Y C R” é uma 
bijeção contínua f : X — Y cuja inversa f7! : Y —> X também é contínua. 


Exemplo 14. A aplicação f : [0, 2m) —> S!, definida por f(t) = (cost, sent), 
é uma bijeção contínua mas não é um homeomorfismo. Sua inversa f7! : S! > 
[0, 27) aplica o compacto S! sobre o intervalo [0, 27), que não é compacto, logo 
é descontínua. Mais precisamente, f7! é descontínua no ponto a = (1,0) = 
fO) e S!. Com efeito se pusermos, para cada k e N, t = (1 — 1/k) -27x e 
zk = (cos tę, sen t), teremos lim z; = a mas lim f7! (z4) = limt, = 27, logo 
não vale lim f7! (zx) = f Ha) = 0. < 
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Exemplo 15. A bola aberta B = B(0; 1) c R” é homeomorfa ao espaço R”. De 
fato, as aplicações f : R” >» B e g : B > R”, definidas por 


fœ) = 


X 
e == 
ER Sa] 


são contínuas e, como se verifica sem dificuldade, vale g(f (x)) = x, f(g0)) = y, 
para quaisquer x € R” e y = B, logo g = fr. x 


Exemplo 16. Sejam S” = {x € R”+!; (x,x) = 1) a esfera unitária n-dimensio- 
nale N = (0,...,0, 1) € S” seu pólo norte. A projeção estereográfica É : S” — 
{N} — R” é um importante exemplo de homeomorfismo. Para todo x € S” — 


{N}, E(x) é o ponto em que a semi-reta Nx corta o hiperplano x,.,1 = O, o qual 


identificamos com R”. Os pontos da semi-reta Nx são da forma N + t(x — N) 
com t > 0. Um tal ponto está no hiperplano R” quando sua última coordenada 
1 + t(xn+1 — 1) é igual a zero, ou seja, quando t = 1/(1 — x,,1). Logo &(x) = 
x/(1 — Xn+1), onde x’ = (x1, ..., Xn) para x = (X1, ..-, Xn, Xn41). Isto mostra 
que £ : S” — {N} > R” é contínua. Seja agora q : R” —> S” — {N} dada por 
o) = x, onde x' = 2y/(|y/ + 1) e xı = (ly? — 1)/(lyl? + 1). Uma 
verificação simples mostra que É (y(y)) = y para todo y € R” e q(E(x)) = x para 
todo x € $”. Portanto a aplicação contínua q : R” —> S” — {N} é a inversa de & 


e, conseqüentemente, É é um homeomorfismo. < 


Teorema 23. Se K C R” é compacto então toda aplicação contínua injetiva 
f: K > R” é um homeomorfismo sobre sua imagem (compacta) L = f (K). 


P4 


Demonstração. Chamemos de g : L —> K a inversa de f. Como L cC R” é 
compacto, portanto fechado, pelo Teorema 19, g é contínua se, e somente se, para 
todo conjunto fechado F C R”, a imagem inversa g7! (F) = 8!(F N K) é um 
fechado em R”. Mas FNK é compacto, logo g !(FNK) = f (FAK) é compacto 
(em virtude do Teorema) logo é fechado. 


O teorema acima mostra por que foi possível dar o Exemplo 14: o intervalo 
[0, 27) não é compacto. 


10 Conjuntos conexos 


P4 


Uma cisão do conjunto X C R” é uma decomposição X = A U B onde A N B = 
AN B = ø, isto é, nenhum ponto de A é aderente a B e nenhum ponto de B é 
aderente a A. 

Um exemplo óbvio é a cisão trivial X = X U Ø. Já R — {0} = (-00,0)U 
(0, +00) é uma cisão não-trivial. Por outro lado, pondo A = (-00,0] e B = 
(0, +00) a decomposição R = A U B não é uma cisão pois 0 € AN B. 
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Se X = AU B é uma cisão então os pontos de X que são aderentes a A, não 
pertencendo a B, estão em A, logo A = AN X. Analogamente, B = BN X. 
Assim, A e B são ambos fechados em X. Com A = X — B e B = X — A, segue-se 
que A e B são também abertos em X. 

Reciprocamente, se A C X é aberto e fechado em X então, pondo B = X — A, 
a decomposição X = AU B é uma cisão. Com efeito, nenhum ponto de X aderente 
a A pode pertencer a B pois A é fechado em X e, da mesma forma, nenhum ponto 
de X aderente a B pode pertencer a A. 

Em particular, se X C R” é aberto, uma cisão X = A U B é uma expressão 
de X como reunião de dois abertos disjuntos. E se X C R” é fechado, toda cisão 
X = AUB éa expressão de X como reunião de dois conjuntos fechados disjuntos. 
Mais particularmente ainda, se X é compacto então A e B são compactos. 


Exemplo 17. Escrevendo as linhas de uma matriz, uma após a outra, numa só 
lista, identificaremos o espaço R” como conjunto das matrizes quadradas n x n. 
Sejam Gn, G+ e G- respectivamente os conjuntos das matrizes com determinante 
* 0, das matrizes com determinante > O e com determinante < 0. A igualdade 
Gn = G,UG. é uma cisão. Com efeito, como o determinante é uma função real 
contínua det: G, —> R, uma segiiência de matrizes com determinantes positivos 
não pode convergir para uma matriz de determinante negativo. Assim G} N G. = 
Ø. Analogamente, G} N G. = Ø. 

Um conjunto X C R” chama-se conexo quando só admite a cisão trivial. Caso 
contrário, diz-se que X é desconexo. 

Como vimos no Exemplo 17 acima, o conjunto das matrizes n x n com deter- 
minante Æ O é desconexo. 

Na página 51 do vol. 1 foi provado que todo intervalo da reta R (seja ele aberto 
ou não, limitado ou não) é conexo. 

Vale a recíproca: < 


Teorema 24. Os únicos subconjuntos conexos de R são os intervalos. 


Demonstração. Suponha que X C R não seja um intervalo. Então existem a < 
c < b tais que a,b € X ec ¢ X. Neste caso, pondo A = {x € X;x < c}e 
B = {x € X; x > c}, vemos que X = A U B é uma cisão. Comoa € Aeb €B, 
esta cisão não é trivial. Portanto X é desconexo. 


Teorema 25. (a) A imagem do conjunto conexo X C R” por uma aplicação 
contínua f : X —> R” é um conjunto conexo. 


(b) A reunião X = |] X, de uma família qualquer de conjuntos conexos X, C 
AEL 
R” que têm um ponto a em comum é um conjunto conexo. 
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Z 


(c) O produto cartesiano X x Y C R”™ dos conjuntos X C R” e Y CR" é 
um conjunto conexo se, e somente se, X e Y são conexos. 


(d) O fecho de um conjunto conexo é conexo. 


Demonstração. (a) Se f(X) = AU B é uma cisão da imagem de X então A e B 
são ambos abertos e fechados em f (X), além de disjuntos. Logo f7! (A) e f7!(B) 
são também disjuntos, abertos e fechados em X, portanto X = fT!(A) U f-!(B) 
é uma cisão, a qual é trivial pois X é conexo. Mas A = ff! (A) e B = ff'(B) 
porque 4 e B estão contidos em f(X). Assim, A ou B é vazio e daí a cisão 
f(X) = AU B é trivial. Então f(X) é conexo. 

(b) Seja a tal que a € X, para todo À € L. Se X = A U B é uma cisão então 
o ponto a pertence a um dos conjuntos, A ou B. Digamos que a € A. Para todo 
à € L, X, = (AN X1) U (B N X1) é uma cisão, qual é trivial pois X, é conexo. 
Como a € AN X,, segue-se que B N X; é vazio. Logo B = [J(BN X1) é vazio 

A 


e a cisão X = AU B é trivial. Portanto X é conexo. 

(c) Se X x Y é conexo então X e Y são conexos porque são as imagens 
de X x Y pelas projeções p: X x Y > X, p(x, y) =xeg: XxY >Y, 
q(x, y) = y as quais são contínuas. Reciprocamente, se X e Y são conexos, 
tomamos um ponto c = (a, b) € X x Y. Para cada z = (x, y) € X x Y o conjunto 
C; = (X x {b})U ({x} x Y) é conexo pois é reunião dos conjuntos conexos X x {b} 
e {x} x Y (homeomorfos respectivamente a X e Y) com o ponto (x, b) em comum. 
Além disso, também c = (a, b) € C, para todo z € X x Y e X x Y = |J C, logo, 

A 


pelo item (b), X x Y é conexo. 

(d) Seja X = AUB umacisão. Então X = (AN X) U (BN X) também é uma 
cisão pois (AN X)N (BAX) CANB=gØe(ANX)N(BAX) CANB=Ø. 
Como X é conexo, tem-se, digamos, A N X = 9. Ora, existe U C R” aberto tal 
que A = UN X. Daí AN X = (UN X) N X = U NX, logo U N X = Ø. Sendo 
U aberto, de U N X = 9 segue-se que nenhum ponto de U é aderente a X. Então 
UN X = Ø, ou seja, A = Ø. 

Assim, toda cisão X = A U B é trivial, portanto X é conexo. 


Corolário 6. Se X4,..., Xg são conexos então X, x --- X Xy é conexo. Em 
particular, R” = R x --. x R é conexo. 


Com efeito, X; x X2 x X3 = (X1 x X2) x X3 e assim por diante. 


Corolário 7. Se X C R” é conexo então a imagem de toda função real contínua 
f: X — R é um intervalo. 


Com efeito, pelo Teorema 24 todo subconjunto conexo de R é um intervalo. 
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Este corolário é conhecido como o Teorema do Valor Intermediário pois pode 
também ser enunciado assim: “Sejam X CR" conexoe f : X — R contínua. Se 
a,b € X são tais que f(a) < f(b) então, para cada d com f(a) < d < f(b), 
existe c € X tal que f(c) = d.” 


Corolário 8 (“Teorema da Alfândega”). Seja X C R” um conjunto arbitrário. 
Se um conjunto conexo C C R” contém um ponto a € X e um ponto b É X então 
C contém um ponto c € fr.X. 


Com efeito, a função contínua f : C —> R, definida por f(x) = d(x, X) — 
d(x, R” — X), é tal que f(a) < Oe f(b) > 0. Logo, pelo Teorema do Valor 
Intermediário, deve existir c € C tal que f(c) = O, isto é, d (c, X) = d(c, R” — X). 
Como um desses dois números é zero, ambos o são e daí c € fr.X. 

Como R” é conexo, resulta do corolário acima que se o conjunto X C R” não é 
vazio nem coincide com R” então a fronteira de X não é vazia. De fato, se X £ Ø 
e X £ R” então o conjunto conexo R” contém algum ponto de X e algum ponto 
que não pertence a X, logo contém algum ponto da fronteira de X. 


P4 


Exemplo 18. Para todo n € N, a esfera S” é um conjunto conexo. Com efeito, 


retirando o pólo norte N = (0,...,0, 1), vemos que X = S” — {N } é conexo por 
ser homeomorfo a R” (cfr. Exemplo 16). Como S” = X, segue-se do item (d) que 
a esfera S” é conexa. < 


Exemplo 19. Uma conseqüência do Teorema do Valor Intermediário é que para 
toda função real contínua f : S! —> R existe (pelo menos) um ponto z € S! tal que 
f(D) = f(—z). Para ver isto, consideremos a função contínua q : S! —> R, dada 
por p(z) = f(z) — f(—z). Vale p(—z) = —ọ(z). Assim, ou (z) = O para todo 
z (assunto encerrado) ou existe a € S! com p(—a) < 0 < g(a), logo p(z) = 0 
para algum z € S!, pois S! é conexo. < 


Existe uma noção bem geométrica que fornece uma condição suficiente para a 
conexidade de um conjunto, que é a conexidade por caminhos. 

Um caminho num conjunto X C R” é uma aplicação contínua f : I > X, 
definida num intervalo 7. 

Por exemplo, dados x,y e R”, o caminho f : [0,1] —> R”, definido por 
f = (1 — t)x + ty, chama-se o caminho retilíneo que liga x a y. Às vezes nos 
referiremos a ele como o caminho [x, y]. 

Diremos que os pontos a,b e X podem ser ligados por um caminho em X 
quando existe um caminho f : I > X tala = f (œ), b = f(p)coma < pel. 

Por exemplo, se X C R” é convexo, dois pontos quaisquer a, b € X podem ser 
ligados por um caminho em X, a saber, o caminho retilíneo [a, b]. 
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Se a,b e X podem ser ligados por um caminho f : I —> X, então existe 
um caminho q : [0,1] > X tal que q(0) = a e q(1) = b. Basta pôr (t) = 
f(Q — Da + tp), onde a = f(a) e b = f(B). 

Se f, g : [0,1] > X são caminhos em X, com f(1) = g(0), então definimos o 
caminho justapostoh = f V g : [0,1] > X pondo A(t) = fOt)se0 <t < 1/2 
e h(t) = g(2t — 1) se 1/2 < t < 1. Note que estas duas expressões definem 
o mesmo valor de h(1/2). Como A|[0, 1/2] e h|[1/2,1] são contínuas, segue-se 
que h é contínua. Intuitivamente, o caminho h percorre a trajetória de f (com 
velocidade dobrada) até t = 1/2 e depois, para t > 1/2, descreve (ainda com 
velocidade dobrada) o percurso de g. 

Sejam a, b, c pontos do conjunto X C R”. Se a, b podem ser ligados por um 
caminho em X e b, c também podem ser ligados por um caminho em X, então 
existe um caminho em X ligando a a c. Basta tomar caminhos f, g : [0,1] > X 
com f(0) = a, HD) = b, g(0) = b, g(1) = c e pôr h = f v g. Então 
h(0) =a, h(1) =c. 

Um conjunto X C R” diz-se conexo por caminhos quando dois pontos quais- 
quer a, b € X podem ser ligados por um caminho em X. 

Todo conjunto convexo X C R” é conexo por caminhos. Em particular, toda 
bola (aberta ou fechada) no espaço euclidiano é conexa por caminhos. 

A esfera S” = {x € R”+!; (x,x) = 1) é conexa por caminhos. Com efeito, 
dados a, b € S”, se a e b não são antípodas, isto é, se b £ —a, então f : [0,1] > 
S”, definida por 


I-Da+tb 


RE 


é contínua (pois seu denominador nunca se anula), com f(0) = a, f(1) = b. Se, 
porém, b = —a, tomamos um ponto c € S” — (a, b}, ligamos a com c e c com b 
pelo processo acima. O caminho justaposto ligará o ponto a ao seu antípoda b. 
Todo conjunto X C R”, conexo por caminhos, é conexo. 
Com efeito, fixando a E X seja, para cada x e X, Cx a imagem de um caminho 
em X ligando a até x. Pelo item (a) do Teorema 25, Cx é um conjunto conexo que 


contém a e x. Logo, pelo item (b) do mesmo teorema, o conjunto X = |J C, é 


xeX 
conexo. 


A recíproca é falsa. O conjunto Xo C R?, reunião do gráfico da função f(x) = 
sen(1/x),0 < x < 1, com a origem p = (0,0), é conexo mas não é conexo por 
caminhos. (Para a demonstração, ver o livro “Espaços Métricos”, do autor, página 
103.) 

Há, porém, um caso particular importante, no qual a conexidade implica em 
conexidade por caminhos: quando o conjunto X C R” é aberto. 
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Diremos que f : [0,1] > X é um caminho poligonal em X quando f é a 
justaposição de um número finito de caminhos retilíneos. 


Teorema 26. Um aberto A C R” é conexo se, e somente se, é conexo por cami- 
nhos. 


Demonstração. Seja A C R” aberto e conexo. Fixemos um ponto a E Ae 
consideremos o conjunto U , formado pelos pontos x e A que podem ser ligados 
ao ponto a por um caminho poligonal contido em A. Afirmamos que U é aberto. 
Com efeito, seja x e U. Sendo A aberto, existe B = B(x; r), com x € BC A. 
Como a bola B é convexa, todo ponto y € B pode ser ligado a x por um segmento 
de reta contido em B, logo y se liga a a por um caminho poligonal contido em 
A. Portanto B C U e U C A é aberto. Também V = A — U é aberto, pois 
se v € V então v não pode ser ligado a a por um caminho poligonal contido em 
A. Tomando uma bola aberta B}, com v € Bı C A, todo z € B; se liga a v por 
um segmento de reta contido em B,. Se z pudesse ser ligado a a por um caminho 
poligonal contido em A, justapondo-se [v, z] a esse caminho, veríamos que v € U, 
um absurdo. Temos então A = UU V, uma cisão. Como A é conexo ca E U, 
temos V = Ø, donde A = U, o que prova o teorema. 


Corolário 9 (da demonstração). Se A C R” é aberto e conexo, dois pontos 
quaisquer de A podem ser ligados por um caminho poligonal contido em A. 


Mostraremos a seguir que todo conjunto X C R” se exprime como reunião 
disjunta de subconjuntos conexos máximos, chamados componentes conexas de X. 

Sejam x e X C R”. A componente conexa do ponto x no conjunto X é a 
reunião C, de todos os subconjuntos conexos de X que contêm o ponto x. 

Por exemplo, se X = Q C R então a componente conexa de qualquer ponto 
x € X é (x). Por outro lado, se X C R” é conexo então, para todo x € X temos 
Co = X. Se X = R — {0} então a componente conexa de 1 em X é (0, +00) 
enquanto que a componente conexa de —1 é (— oo, 0). 

Dados x e X C R”, a componente conexa Cy é um conjunto conexo, pelo 
Teorema 25(b). Na realidade, C, é o maior subconjunto conexo de X contendo o 
ponto x. Com efeito, se C C X é conexo e contém x, então C é um dos conjuntos 
cuja reunião é C,, logo C C C,. Mais ainda, se C C X é conexo e tem algum 
ponto em comum com C, então C C Cx, pois C U C, é conexo contendo x logo 
CUC, C C, edaí C C C,. Em particular, nenhum subconjunto conexo de X 
pode conter C, propriamente. 

Sejam x, y dois pontos de X. Suas componentes conexas C, e C, ou coincidem 
ou são disjuntas pois se z € C, N C, então C, C Cy e Cy C Cy. Assim a relação 


Z 


“x e y pertencem à mesma componente conexa em X” é uma equivalência no 
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conjunto X. As classes de equivalência são as componentes conexas dos pontos 
de X. 

Toda componente conexa Cx é um conjunto fechado em X. Com efeito, sendo 
C. C NX Cc C, o Teorema 25(d) nos assegura que C, N X é um subconjunto 
conexo de X, contendo C,. Logo C.AX=C,,0 que mostra que C, é fechado 
em X. 


11 Limites 


Sejam f: X — R” definida no conjunto X C R” ea e R” um ponto de 
acumulação de X. Diz-se que b € R” é o limite de f(x) quando x tende para a e 
escreve-se lim f(x) = b quando a seguinte condição é válida: 


“para todo e > O dado, existe ô > Otalgquex e Xe0O<|x—a| < ô 
implicam | f(x) — b| < ê.” 


O ponto a pode pertencer ou não a X. Em muitos dos exemplos mais importan- 
tes de limite, na verdade, tem-se a é X. Mas, mesmo que pertença a X, o ponto 
aeo valor f(a) não desempenham papel algum na definição de limite. 

Quando o ponto de acumulação a pertence a X, a aplicação f: X > R” é 
contínua no ponto a se, e somente se, lim f(x) = f(a). 

A propriedade seguinte decorre imediatamente da definição mas é útil o bastante 
para ser destacada como um teorema. 


Teorema 27 (Permanência do sinal). Sejam a um ponto de acumulação de X C 

R” e f : X > R uma função real. Seb = lim f(x) é um número positivo então 
x—>a 

existe ô > Otalquex € X eQ < |x — a| < ô implicam f(x) > 0. 

Demonstração. Como b é positivo, tomamos € = b. Pela definição de limite, 


existe ô > 0 tal que x e Xe0 < |x — a| < ôimplicam b — e < f(x) <b+e, 
isto é, 0 < f(x) < 2b, logo f(x) > 0. 


Quando X é um intervalo da reta, tem sentido a noção de limite lateral de uma 
aplicação f : I — R”, ou seja, de um caminho, num ponto a € I. Por exemplo, 
se a não é o extremo superior de Z, diz-se que b e R” é o limite à direita de f (t) 
quando ż tende para a, e escreve-se dim, f(t) = b, para significar que 


“para todo £€ > 0 dado, existeô > O tal quea < t < a + ô implica 
telTelf(D)—b|< e” 
Analogamente se define o limite à esquerda lim f(t). 
t>a— 


Assim como a continuidade de uma aplicação, a existência ao valor do limite 
se exprimem em termos das funções-coordenada, como veremos agora. 
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Teorema 28. Seja a um ponto de acumulação do conjunto X C R”. Se as funções- 


coordenada da aplicação f: X —> R" são fi,..., fa: X —> R então tem- 
se lim f(x) = b = (b,,...,b,) se, e somente se, lim f;(x) = b; para cada 
LS Ash: 

Demonstração. Se lim f(x) = b então, para cada i = 1,...,n, tem- 
se lim f(x) = b; porque |fi(x)—bi;l < |f(x) — b|. Reciprocamente, se 
lim fi(x) = b; para cada i = 1,...,n então lim f(x) = b porque | f(x) — b| < 
DO) bil. 

i=l 


A proposição seguinte relaciona o limite de aplicações com o limite de seqüên- 
cias. 


Teorema 29. Seja a um ponto de acumulação do conjunto X C R”. A fim de 
que se tenha lim f(x) = b é necessário e suficiente que, para toda seqüência de 
x—>a 


pontos xp e X — {a} com lim x, = a, seja lim f (xp) = b. 

A demonstração é idêntica à feita no vol. 1 (pág. 63). 
Teorema 30. Sejam: a um ponto de acumulação de X C R”, b € Y um ponto 
de acumulação de Y C R", f : X > Y uma aplicação tal que lim f(x) = b e 
g : R? contínua no ponto b. Então lim g(f(x)) = g(b). 


Isto é mais fácil de provar do que enunciar. Basta imitar a demonstração de que 
a composta de duas aplicações contínuas é contínua (Teorema 14). 


Teorema 31. Sejam fg: X>R ea: X — R definidas no conjunto X C R” 
e a um ponto de acumulação de X. Se existem lim f(x) = b, lim g(x) = ce 


lim a(x) = wo, então existem os limites e valem as igualdades abaixo: 
xa 


lim [f6)+sG)]=b+c, lim a) fŒ) = a:b 


lim (f0),80))=(b,c), lim [fœ] = Ibl. 


Demonstração. A aplicação s : R” x R” —> R”, definida por s(x, y) =x +y, é 
contínua. Observando que f(x) + g(x) = s(f (x), g(x)), resulta do Teorema 31 
que lim[ fŒ) + g(x)] = lim Ff) + lim g(x) = b +c. Analogamente para as 
outras três igualdades. 
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Além disso, é útil saber que se lim a(x) = 0e f: X > R” é limitada na 
vizinhança de a (isto é, existem ô > 0 e M > Q tais que x € Xelx—a|l < ê 
implicam | f (x)| < M) então lim æ (x) f(x) = 0, mesmo que não exista lim f(x). 
(Muito fácil.) o 


Exemplo 20. Seja g : R? — {0} —> R definida por g(x, y) = x?y/(xº + y”). 
Então podemos escrever g(x, y) = a(x, y) - f(x, y) onde a(x, y) =x e 


AY x y 


= . = cos 0 sen 0, 
+24 2+Y 


fæ, y)= 


sendo 6 o ângulo de eixo O X com o segmento Oz, z = (x, y). Assim, temos 


lim g@(x,y)=0 
(14,3) (0,0) 


e xX, < 1, logo lim x,y) =0. < 
If œ, y)| g E PERA y) 


Agora que já vimos ser lim (f(x) — g(x)) = lim f(x) — lim g(x), podemos 


demonstrar a seguinte conseqüência do Teorema 27: 


Teorema 32 (Permanência da desigualdade). Sejam f, g : X —> R definidas no 
conjunto X C R” e a um ponto de acumulação de X. Se f(x) < g(x) para todo 
x € X e existem lim f(x) e lim g(x) então tem-se lim f(x) < lim g(x). 


Demonstração. Se fosse o contrário, lim f(x) > lim g(x), teríamos lim (f(x) — 
b ra i XG xXx>a 

g(x)) > 0 e então, pelo Teorema 27, valeria f(x) > g(x) para todo x € X 

suficientemente próximo de a, uma contradição. 


Capítulo 2 


Caminhos em R” 


1 Caminhos diferenciáveis 


Seja f: I — R” um caminho, isto é, uma aplicação contínua cujo domínio é 
um intervalo da reta. Para todo t € I, tem-se f(t) = (CfAi(t),..., fa(t)), onde 
fis ---, fa: I — R, as funções-coordenada de f, são contínuas. 

Diz-se que o caminho f : I —> R” é diferenciável no ponto tọ € I quando 
existe o limite 


f(to+h)— f(to) 
7 ; 


f'o) = lim 


chamado a derivada, ou o vetor-velocidade de f no ponto tọ. 

Para todo h + 0, as coordenadas do vetor [ f (to +A) — f (to)]/ h são os números 
[fi(to4-h) — fi(to)]/h(i = 1,...,n). Pelo Teorema 28 do Capítulo 1, o caminho 
f é diferenciável no ponto to se, e somente se, suas funções-coordenada o são. No 
caso afirmativo, tem-se f(to) = (fi(to),..., filto)). Às vezes se usa também a 
notação (0) em vez de f'(to). 

Quando o caminho f : I —> R” é diferenciável em todos os pontos de Z, diz-se 
que ele é diferenciável em I. Neste caso, a correspondência t > f'(t) define 
uma aplicação f’: I —> R”. Quando f' é contínua, o caminho f chama-se de 
classe C!. Mais geralmente, para todo inteiro k > 1, diz-se que f : I > R” é 
um caminho de classe C* quando ele é diferenciável e f’ é de classe C*7!. Para 
que f seja de classe C* é necessário e suficiente que cada uma de suas funções- 
coordenada o seja. Escreve-se então f e Cf. 

No caso em que f'(to) # 0, a definição acima significa que a reta que passa 
pelo ponto f (to) e tem a direção dada pelo vetor f’(to), isto é, o conjunto { f (to) + 
a - f(to);a € R}, é o limite da secante que passa pelos pontos f (to) e f (to + h) 
quando h — 0. Logo é natural chamá-la de reta tangente ao caminho f no ponto 
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t. Quando f'(t9) = O pode não haver reta alguma que se possa chamar de tangente 
do ponto f (to). 


Figura 1. 


Exemplo 1. Dados a £ b em R”, seja f : R —> R” o caminho retilíneo que passa 
pelos pontosaeb : f(t) = (1 — t)a +t -b. Para todo t € R, f é diferenciável no 
ponto t, com f'(t) = b — a, como se vê diretamente a partir da definição. 

Se to não é o extremo superior do intervalo Z, tem sentido considerar a derivada 
à direita do caminho f : I —> R” no ponto tọ, a qual é definida por 


fto +h) — f(to) 
7 ; 


f (to) = as 


e, de modo análogo, a derivada à esquerda f'(to—), caso to não seja o extremo 
inferior de 7. Quando ty é um ponto interior de 1 então f é diferenciável no ponto 
fo se, e somente se, existem as derivadas f; (to) e f” (to) sendo elas iguais. < 


Exemplo 2. Seja f : R —> R? o caminho definido por f (t) = (t, |t|). Parat > 0 
tem-se f(t) = (t,t) e, parat < 0, f(t) = (t, —t). Logo, para todo t Æ O existe 
Ff'(t), sendo f(t) = (1,1) set > Oe f(t) = (1,-1) set < O. No ponto 
t = 0 existem as derivadas laterais fi (0) = (1, 1) e f1 (0) = (1, —1), que são 
diferentes, logo f não é diferenciável no ponto t = 0. Por outro lado, o caminho 
g : R — R?, definido por g(t) = (t|t|, t°), tem a mesma imagem que f porém é 
derivável em todos os pontos, inclusive para t = 0, valendo g'(0) = (0, 0). Com 
efeito, set < O então g(t) = (—t?, t°) e se t > O vale g(t) = (t?, t°). Portanto 
g'(t) = (—2t, 2t) quando t < O e g'(t) = (2t,2t) set > 0. No ponto t = 0, 
temos g/, (0) = g^ (0) = (0, 0). < 


Exemplo 3. Sejam f : R —> R? e g : R —> R? os caminhos definidos por f(t) = 
(cost, sent) e g(t) = (cost, sent, t). A imagem de f é a circunferência unitária 
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Figura 2. 


S! e a imagem de g é a hélice H, cuja projeção sobre o plano z = 0 é S!. Ambos, 
f e g, são de classe C* para todo k € N, por isso se dizem de classe C%. Para 
todo t € R tem-se f'(t) = (— sent, cost) e g' (t) = (— sent, cost, 1). < 


2 Cálculo diferencial de caminhos 


Sejam f, g : I — R” caminhos e œ : I —> R uma função real. Se f, g ea são 
diferenciáveis no ponto fọ € 1 então são também diferenciáveis nesse ponto os 
caminhos f + g, af e as funções (fg) e lfl= V(f,f), esta última sob a 
condição de ser f (to) £ 0. 

Valem então as regras abaixo: 


1. (f +8) (to) = f'(to) + 8 (to), 
2. (af) (to) = a’ (to) - f (to) + alto): f (to), 
3. (f, 8Y (to) = ( f'(to), 8(to)) + ( f (to), g (to)), 


tt) — 4LG0).f'G0)) 


as quais se provam simplesmente calculando em termos das coordenadas de 
feg. 

Vimos no Exemplo 3 que, em cada ponto, o vetor-velocidade f'(t) = 
(— sen t, cost) é perpendicular a f(t) = (cost, sent). A última das regras de 
derivação acima, segundo a qual | f| = (f, f”) / |f|, mostra que, mais geralmen- 
te, se f : I — R” é um caminho diferenciável com |f| constante (isto é, f(t) 
pertence a uma esfera de centro 0) então o vetor-velocidade f'(t) é perpendicular 
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a f(t), para todo t € I. Reciprocamente, se ( f(t), f(t)) = O para todo t € I 
então | |" = 0, logo a função real |f|: Z —> R é constante. 

Vale também para caminhos diferenciáveis f : Z —> R” o fato de que derivada 
identicamente nula implica f constante. Isto pode ser visto diretamente ou a 
partir do Teorema do Valor Médio, o qual assume, para caminhos, a forma de uma 
desigualdade. 

O Teorema do Valor Médio para funções diferenciáveis f : [a, b] —> R diz que 
existe c, coma < c < b, tal que f(b) — f(a) = f(c)(b — a). Tal igualdade 
não vale sempre para caminhos f : I —> R”. Por exemplo, se considerarmos 
f: [0,27] — R?, dado por f(t) = (cost, sent), temos f(27) — f(0) = 0 
mas, como | f'(t)| = 1 para todo t € [0, 27] não pode existir c € [0,277] tal que 
fr) — f0) = f(c) 2x — 0). 


Tem-se entretanto o seguinte importante resultado: 


Teorema 1 (Desigualdade do Valor Médio). Seja f : [a, b] > R” um caminho, 
diferenciável no intervalo aberto (a, b), com |f(D)| < M para todo t E (a,b). 
Então | f (b) — f (a)| < M - (b — a). 


Demonstração. Definamos q : [a, b] > R pondo q(t) = ( f(t), f(b) — f (a)). 
Então, pelo Teorema do Valor Médio (Vol. 1, pág. 96), existe c € (a,b) tal 
que (b) — o(a) = q'(c) - (b — a), pois q é contínua, derivável em (a, b), com 
PD = ( FE, f- fa) ). Mas (b)— (a) = |f (b) — f(a). Logo, usando 
a desigualdade de Schwarz, temos: 


(fo), fŒ) — Fa))-(b— a) 
CO FD) — Fla): (b-a) 
M -|f Œ) — fa) -(b— a). 


Cancelando o fator | f (b) — f (a)|, vem |f(b) — fla)l<M-(b-—a). 


If Cb) — Fla) 


IA IA 


Corolário 1. Se o caminho f : [a,b] > R” tem derivada nula em todos os pontos 
de (a, b) então é constante. 


Teorema 2 (Regra da Cadeia). Sejam py: I > J diferenciávelno ponto a E I 
e f : J > R” em caminho diferenciável no ponto b = f(a). Então o caminho 
fog: I— R” é diferenciável no ponto a, com (f o q) (a) = p' (a) - f'(b). 


Demonstração. Aplicar a Regra da Cadeia às funções-coordenada f; o q do cami- 
nho f oq. 


Exemplo 4. Sejam f: R >» R? eg:R — R, com f(t) = (cost, sent) e 
(t) = t?. Então o caminho fog : R —> R?, dado por (foy)(t) = (cost?, sen t°), 
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tem vetor-velocidade (f o q)'(t) = (—2t sen t?, 2t cost?) = 2t -(— sen t?, cos t?), 
múltiplo escalar do vetor-velocidade de f no ponto (t). 

De um modo geral, a Regra da Cadeia diz que o caminho t œ> f(ọ(t)), cuja 
imagem está contida na imagem de f, tem, para cada t € I, vetor-velocidade igual 
a um múltiplo escalar do vetor-velocidade de f em q(t). < 


3 A integral de um caminho 


Lembramos que uma partição do intervalo [a, b] é um conjunto finito P = {tọ < 
ti <- < tg} com tọ = a e tz = b. A norma de P é o número |P| = max{t; — 
ti—1;i = 1,..., k}. Diz-se que outra partição Q refina P quando P C Q. Uma 
partição pontilhada é um par P* = (P, £) onde E = {&1, .. . , Ez} com t;-1 < E; < 
t, l <i<k. 

Dados o caminho f : [a, b] — R” e uma partição pontilhada P* = (P, E) de 
[a, b], a soma de Riemann de f associada a P* é definida como 


k 
D a a das 
i=l 


Diz-se que o vetor v € R” é o limite da soma de Riemann 5 (f; P*) quando 
a norma de P tende a zero, e escreve-se v = aA X(f; P*), para significar que, 
=% 


dado arbitrariamente £ > 0, existe ô > 0 tal que |P| < ô > |v — 5 (f; P)| < e, 
seja qual for a maneira de pontilhar P. 

Vimos no Volume 1 (págs. 127 e 137) que se f : [a, b] > R é contínua então 
existe limp >0 X} (f; P*) = E f(t)dt. Daí resulta que, se f : [a,b] > R” é 
um caminho, existe o limite 


b b 
jm, DEP =à f nar... f noa), 


Pomos, por definição, 


b 
| Fod = im Da. 


Segue-se da propriedade correspondente para funções reais que 


b b b 
J EROE J fed + B J sdr 


Além disso, tem-se a importante desigualdade 


b 
J fdt 


b 
< J fode, 
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a qual decorre do fato de que, para toda partição pontilhada P* tem-se 


| FPI 


pois a norma de uma soma é menor do que ou igual à soma das normas das parcelas. 
Em particular, se | f (t)| < M para todo t € [a, b] então 


b 
y) fdt 


Exemplo 5. Se f : [0,27] > R? e g: [0,1] > R? são dados por f(t) = 
(cost, sen t) e g(t) = (t, t?) então [7 f@dt = (0,0) e fo gdt = (1/2, 1/3). 


< 


E nr) 


<M-(b-a). 


Aplicando o Teorema Fundamental do Cálculo a cada uma das coordenadas do 
caminho de classe C! f : [a, b] > R”, obtemos o seguinte 


Teorema 3 (Teorema Fundamental do Cálculo para Caminhos). Se f: [a,b] 
— R” é um caminho de classe C! então 


b 
J fd = f(b)- Jo 


Daí resulta outra prova da Desigualdade do Valor Médio (no caso particular de 
feC!),poisse | f'(t)| < M para todo t € [a, b] então 


b 
| f'tdt 


Exprimindo novamente a integral de um caminho em termos das integrais de 
suas funções-coordenada resulta o Teorema de Mudança de Variável seguinte 
Se q: [c, d] > [a, b] é de classe C! e f : [a, b] > R” é um caminho então 


If ®©) — fa) = <M-(b-a). 


o(d) d 
fOdi= | FOD Od. 

g(c) c 

Uma simples aplicação desta fórmula nos permite enunciar o Teorema Funda- 
mental do Cálculo assim: se f : [a,a + h] > R” é um caminho de classe C! 
então f(a +h) — f(a) =h. fy f'(a +th)dt. 

Basta considerar q : [0,1] —> [a,a + h] onde q(t) = a + th e notar que 
gt) = A. 

Um caminho f: I —> R” diz-se uniformemente diferenciável quando, para 
todo t € I existe um vetor f'(t) € R” com a seguinte propriedade: 
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Dado qualquer £ > 0, pode-se obter ê > O tal que O < |A] < ê 
et+h e I implicam |ft+h)— f(D)-—-Ff(t)-h| < elh| para 
qualquer t € 1. 


A diferença entre a diferenciabilidade uniforme e a diferenciabilidade pura e 
simples situa-se no fato de que o número ô > 0 depende apenas do € > 0 dado, 
mas não do ponto t € 7 onde se toma a derivada f'(t). 


Teorema 4 (Diferenciabilidade Uniforme). Todo caminho f : [a,b] > R”, de 
classe C! no intervalo compacto la, b], é uniformemente diferenciável. 


Demonstração. Pela continuidade uniforme da derivada f’ : [a,b] — R”, dado 
e€ > Oexisteô > Otalque|h| < Set+h e Ta, bjimplicam|f'(t+h)— O| < e 
seja qual for t € [a, b]. Observando que, para t € [a, b] fixo vale ia Ff(t)ds = 
f'(t)-h, o Teorema Fundamental do Cálculo nos diz que O < |A| < det+h e [a,b] 
implicam 


t+h 
FEL fO- F'O- h= J LFG) — F'Olds| <e- lhl 


para qualquer t € [a, b], o que demonstra o teorema. 


Observação. Vale a recíproca: todo caminho f : [a,b] — R” uniformemente 
diferenciável é de classe C!. (Vide “Curso de Análise”, vol. 1, pág. 218 e vol. 2, 


pág. 88.) 
4 Caminhos retificáveis 


O comprimento de um caminho f : [a,b] —> R”, que definiremos a seguir, é a 
medida da trajetória percorrida pelo ponto f (t) quando t varia de a até b. Não é o 
comprimento da curva imagem de f, pois o ponto f (t) pode percorrer essa mesma 
curva de vários modos diferentes, dando origem a caminhos de comprimentos 
diversos. Por exemplo, o segmento de reta que vai da origem ao ponto P = (1,1) 
do plano tem comprimento 2. O caminho f : [0,2] > R?, definido por f(t) = 
(2t — t°, 2t — t°) tem por imagem esse segmento, porém o percorre duas vezes, 
saindo de f(0) = (0, 0), indo até f(1) = (1, 1) e voltando até f(2) = (0,0). Seu 
comprimento é, como veremos, igual a 2,/2. 

Dado um caminho f : [a, b] > R”,cadapartiçãoP = {a = tọ < --- < t = b} 
de [a, b] determina uma poligonal inscrita na imagem de f, cujos vértices são 
os pontos f(a), f (ti), ..., f (tk-1), f(b). O comprimento dessa poligonal é o 
número 


k 
Kf; P) =F 16) — fa). 


i=l 
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Quando não houver perigo de confusão, escreveremos apenas /(P), em vez de 
I(f; P). 

Diz-se que o caminho f : [a,b] > R” é retificável quando o conjunto dos 
números (P), obtidos considerando-se todas as partições P do intervalo [a, b], 
for limitado. Então o supremo desse conjunto chama-se o comprimento do caminho 
f, o qual é representado por I (f). Assim 


I(f) = supl (f; P) = supl (P). 
P P 


Exemplo 6. Seja f : [0,1] > R” o caminho retilíneo f(t) = (1 — t)A + tB. 
Para toda partição P = {0 < ti <--> < tk-1 < 1} de [0, 1] tem-se 


KP) => f0- fti- = J t -— t-)B — Al = |B — A]. 


Assim, obviamente vale /(f) = |B — A]. < 


P4 


Exemplo 7. Um caminho não-retificável f : [a,b] —> R” é aquele em que o 
ponto f(t) descreve uma trajetória infinitamente longa no tempo finito b — a. Um 
exemplo de tal situação é o caminho f : [0,1] — R?, dado por f(t) = (t, p(t)) 
o qual percorre o gráfico da função q : [0,1] —> R. Esta função tem, em cada 


intervalo 
n n+1 
n+l n+42 


o gráfico na forma de um triângulo isósceles de altura 
n 


E Além disso, q(1) = 0. 
Se considerarmos, para cada n € N, a partição 


1 
Poa fo, UESB ae E 1) 


$ n i 2 , 
do intervalo [0, 1], veremos que /(P,) é a soma dos comprimentos dos lados incli- 


nados dos n + 1 primeiros triângulos isósceles que formam o gráfico de q. Logo 
I(P„) é maior do que a soma das alturas desses triângulos, ou seja, 


EE an 
n) > — Pete, ... P 
2 3 n+1 


Como a série harmônica é divergente, segue-se que o conjunto dos números 
I(P) associados ao caminho f é ilimitado, portanto f não é retificável. O caminho 
f tem comprimento infinito. < 


Uma observação simples, porém útil, é a seguinte: se a partição Q do intervalo 
[a, b] refina a partição P então, dado o caminho f : [a, b] > R”, tem-se I(P) < 
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f) 


ALS 
fe 


Figura 3. 


I(Q). Para ver isto, basta considerar o caso em que se obtém Q a partir de P 
acrescentando-lhe um só ponto q, pois cada refinamento de P pode ser pensado 
como a repetição de um número finito desses acréscimos. Ora, se Q difere de P 
pela adição do único ponto q, digamos com pj-1 < q < pj, então 


0) — UP) = f(g) — fi tIS D= FOIS ISO) fpd a O 
pois 


If (p;i) — f (pi-1)l If — f(g) + fa) — fpj- 


IFD — FIA IF — fpi). 


IA 


Como no caso da integral, dado um caminho f : [a,b] —> R” diremos que 
o número real A é o limite de I(P) quando |P| tende a zero, e escreveremos 
a I(P) = A, para significar que, para todo € > O dado, é possível obter ô > 0 


tal que |P| < ô implica |/(P) — A| < e. 

Teorema 5. Se a ACE) = A então A = sup I(P), ou seja, o caminho f : la, b] 
— R” éretificávele I(f) = A. 

Demonstração. Se a (P) = A, é claro que A < sup. (P). Suponhamos, por 
absurdo, que seja A < supl (P). Então existe uma partição Qo tal que A < (09). 


Seja € = (009) — A. Pela definição do limite, podemos obter é > O tal que 
IP|<ô>A-e<MP)<A+e = (Q). Tomemos uma partição qualquer 
Po tal que |P9| < ô. A partição P = Po U Qo, por um lado cumpre |P| < ô, logo 
I(P) < I(Qo) e, por outro lado, refina Qo, logo (09) < I(P). Esta contradição 
prova o teorema. 
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Observação. Vale a recíproca: se f é retificável, então I (f) = m (P). (Vide 
“Curso de Análise”, vol. 2, pág. 99.) Mas somente o teorema acima será usado a 


seguir. 


Teorema 6. Todo caminho f : [a,b] — R” de classe C 1 é retificável e 


KAH = f If Oldt. 

Demonstração. Para toda partição P = {tọ < ti <--- < tri de [a,b], sejam 
2 (P) = PECA O — ti-1) e MP) = MEO — f(t-1)|. Sabemos que 
pa DP) = e If (Dldt. E, pelo RREN para todo £ > O dado arbitrari- 
amente, existe ô > O tal que |P| < ô implica f (ti) — f (tiz1) = [f (tio + pi] 
com l|pil < — para i = 1,...,k. Logo I(P) = EIE- fa) = 
> IF ti) + pilti — ti-1), portanto | $ (P) — I(P)| < 5 loil(ti — ti-1) < e sem- 


= 


pre que |P| < ô. Como NZD) = I |f(t)ldt, resulta daí que RUA) = 


Ei |f'(t)|. Pelo Teorema 5, concluímos que (f) = T F Oldt. 


P4 


Uma reparametrização do caminho f : [a, b] —> R” é um caminho da forma 
foọ: [c,d] > R”, onde ọ : [c,d] — la, b] é uma função de classe C! tal que 
(c) = a, (d) = b e y'(u) > O para todo u € [c, d]. O teorema acima tem, como 
conseqüência imediata, o seguinte 


Corolário 2. Um caminho de classe C!, f : [a,b] > R”, e qualquer sua repa- 
rametrização f o ọ : [c, d] > R” têm o mesmo comprimento. 


Com efeito, pelo Teorema, 


b d 
KP) J IFO dt = J OEE 


d d 
J OE OE J eo o go: 


Para caminhos f : [a,b] —> R” de classe C! com a propriedade adicional 
de que f'(t) Æ O para todo t € [a,b] (chamados caminhos regulares), existe 
uma reparametrização especial, “por comprimento de arco”, que apresentamos 
agora. Dado um tal caminho f, digamos com [(f) = L, definimos a função 
q: [a,b] — [0, L] pondo, para todo t € [a,b], q(t) = ho If (uwldu = Cf | 
[a, t]), comprimento do caminho f | [a, t], restrição de f ao intervalo [a, t]. 
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A função q : [a,b] — [0, L], assim definida, é de classe C!, com ọ'(t) = 
If (DI| > 0 para todo t € [a,b], e p(a) = 0, (b) = L. Logo é uma bijeção 
de [a, b] sobre [0, L], cuja inversa q”! : [0, L] > [a, b] é também de classe C!, 
valendo, para todo s = (t) € [0, L], a fórmula (p”!)(s) = 
(cfr. Vol. 1, pág. 92.) 

Consideremos a reparametrização g = fo g7! : [0, L] — R” do caminho f. 
Para todo s = (t) € [0, L] temos 


1 
Em ed) 
eo IPO 


ft) 


, = =] +! = 
8 (s) = (ps): f (0) FO 


portanto |g'(s)| = 1. 
Então, para todo s € [0, L], o comprimento do caminho restrito g | [0, s] tem 
o valor 


L(g | [0, s]) = | Ig (u)ļdu = A du=s. 
0 0 


Por este motivo, g = f o”! chama-se a reparametrização de f por compri- 
mento de arco. 


is 5 CC fbip A i 
Observação. A fórmula (f) = Í, IF Œ)|dt é importante teoricamente mas, em 
geral, é impraticável procurar calcular essa integral, a não ser numericamente ou 
então em raros casos especialmente escolhidos, como f(t) = (1 — t)A + tb, 
f(t) = (cost, sent) e outros. 


Capítulo 3 


Funções Reais de n Variáveis 


1 Derivadas parciais 


Seja f: U — R uma função definida no aberto U C R”. Para cada i = 1,...,n, 
ai-ésima derivada parcial de f no ponto a = (a1,...,an) E U é o número 
of casta ten = fa) ico f(a... ai +t,...,an)— f(a) 
— (a) = lim = s lim > uM, 
0X; t>0 t t>0 t 


caso este limite exista. Como U é aberto, podemos achar ô > 0 tal que a+ te; e U 
para todo t € (—ô, ô). Então está bem definido o caminho retilíneo À : (—ô, ô) — 


ð 
U, (t) =a + tei. A definição acima diz que (a) = (fo ày (0) = derivada, 
B 


no ponto t = 0, da função real f o à : (—ô, ê) SR. 
Observemos que 9f/0x; significa a derivada de f em relação a sua i-ésima 
variável, seja qual for o nome que se atribua a ela. Assim 


df df df 
Ox; = 0); = OZ; 


, etc. 


Uma notação alternativa, que evitaria mal-entendidos, seria ð; f. Preferimos a 
notação tradicional df/dx; porque ela é conveniente quando se usa a regra da 
cadeia. 

Quando n = 2 ou n = 3, escrevemos (x, y) em vez de (x1, x2) e (x, y, z) em 
vez de (x1, x2, x3). Assim, df/0x é a derivada parcial de f em relação à primeira 
variável, df/Oz é a terceira derivada parcial de f, etc. 


Exemplo 1. Seja f : R? — R definida por f (x, y) = xy/(x? +y?) sex2+y? £ 0 
e f(0,0) = 0. Como f(0, y) = O para todo y e f(x, 0) = O para todo x, segue-se 


que Fa 0) = 0€e ze 0) = 0. Entretanto a função f é descontínua na origem 
x y 
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(0, 0). Com efeito, se chamarmos de 9 o ângulo que o vetor não-nulo v = (x, y) 
forma com o eixo das abcissas, veremos que 


x X. 


. = cos 0 .sen6. 
VE ER 


fœ. y)= 


Logo, atribuindo diferentes valores a O, podemos fazer com que f(x, y) tenha 
limites diferentes quando (x, y) tende para (0, 0) ao longo do segmento x = t cos 0, 
y = t sen 0, ou seja, quando t — 0. < 


O exemplo acima mostra que a existência das n derivadas parciais no ponto a 
não assegura a continuidade da função f nesse ponto. Para cada i = 1,...,n, 
a função A(t) = f(a + te;) é essencialmente a restrição de f ao segmento (a — 
ĉe;, a+ ôe;) da reta que passa pelo ponto a e é paralela ao i-ésimo eixo coordenado 


de R”. A derivada parcial TA = (f o àV (0) dá informação apenas sobre o 
p 


comportamento de f ao longo desse intervalo. Em particular, a existência das n 
derivadas parciais de f no ponto a implica que a restrição de f aos n intervalos 
paralelos aos eixos, que se cortam no ponto a, é contínua, embora não garanta a 
continuidade de f : U > R ema. 

Se df/0x; existe e é positiva em todos os pontos do segmento de reta [a — 
de;,a + 6e;], paralelo ao i-ésimo eixo coordenado, então f é crescente ao longo 
desse segmento: s < t > f(a + sei) < f(a + tei), desde que |s — a| < ô e 
lt— a| < ô. Isto resulta imediatamente do resultado análogo para funções de uma 
variável. 

A noção de derivada parcial também faz sentido para aplicações f : U > R”, 


com U C R” aberto. Sea € U, põe-se, para cada i = 1,...,m: 
of . fla-+te;) — fla) 
— (a) = lim ; 
dx; 1>0 t 
Evidentemente, df/dx; é um vetor de R”. Se f = (fi, ..., fn) então 
Jx, (a) = (=Z (a), ..., dx, (a) ) . 


Neste capítulo, porém, daremos prioridade às funções com valores numéricos. 
Para elas tem sentido o vetor gradiente, conceito de forte apelo intuitivo, que 
contribui para entendermos como cresce (ou decresce) f(x). 
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2 Funções de classe C! 


Seja f : U —> R uma função que possui as n derivadas parciais em todos os pontos 
do aberto U C R”. Ficam então definidas n funções 
a df : U — R, onde df :Xt> df 
əx 3Xn xi dx; 
Se estas funções forem contínuas em U, diremos que f é uma função de classe 
C! e escreveremos f e Cl. 
Uma aplicação f : U —> R”, definida no aberto U C R”, diz-se de classe C! 
quando cada uma de suas funções-coordenada fı, ..., fi: U —> R é de classe C!. 
Muitas propriedades importantes das funções de classe C! resultam de serem 
elas diferenciáveis no sentido seguinte. 
Uma função f : U —> R, definida no aberto U C R”, diz-se diferenciável no 
ponto a € U quando cumpre as seguintes condições: 


(x). 


ð o 
1. Existem as derivadas parciais Sha. quase f (a). 
dx1 O Xn 
2. Para todo v = (&1, ..., Œn) tal que a + v € U, tem-se 
ad 
fla + v) — f(a) = >. x "o; +r(v), onde lim =0. 


i=l 
Observações. 1. Acima, e sempre que fizermos considerações em torno de um 


EET 9 3 
ponto específico a, escreveremos, por simplicidade, 3 em vez de e) (a). 
Xi Xi 


2. A essência da definição da diferenciabilidade está na condição lim (r(v)/lv|) = 


O, pois a igualdade que define o “resto” r (v) pode ser escrita para qualquer função 
que possua as n derivadas parciais. 
.  r(v) . . r(v) 
De lim Ju = 0 resulta que lim r(v) = 0 pois r (v) = ET -|v|. Segue-se 
v> v v> v 


que lim [f(a + v) — f(a)] = 0. Portanto, toda função diferenciável no ponto a é 
contínua nesse ponto. 

Diremos que f : U > R é diferenciável quando f for diferenciável em todos 
os pontos de U. 

Quando n = 1, a função f: U — R é diferenciável no ponto a se, 
e somente se, possui derivada neste ponto pois, como podemos agora dividir por 
v € R, de f(a + v) — f(a) = df/dx -v + r(v) resulta 


i -Lo] | 
[ul v dx 
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portanto lim Fi a 0 <= lim ia AE E (a). 


v>O lv] v>O v dx 
Teorema 1. Toda função f : U —> R de classe C! é diferenciável. 


Demonstração. Por simplicidade, suporemos U C R?. O caso geral se trata 
analogamente, apenas com uma notação mais elaborada. Fixemos c = (a, b) € U 
e tomemos v = (h, k) tal que c + v € U. Seja 


ro = "(9 = Fla th bto- Hab) = Zn- 2., 


onde as derivadas são calculadas no ponto c = (a, b). Podemos escrever 


r(v) = fla+h,b+k)— fla, b+I) + fla,b+k) — f(a,b) 


Pelo Teorema do Valor Médio para funções de uma variável real, existem 61, 6, € 
(O, 1) tais que 


ð jo) o o 
de oa na eae Le e 
Ox dy əx dy 
logo 
r(v) of of h 
— = |> Oih, b + k) — — (a, b) | ——— 
ju] [ota + ıh, b +k) x 4 | WE 


F E b + 02k) of ») E 
—(a, — — (a, see 
dy Ê dy ~'h? + k? 

Quando v — 0 os termos dentro dos colchetes acima tendem a zero, pela conti- 

nuidade das derivadas 3f/ðx e df/dy. Além disso, os termos fora dos colchetes 


têm valor absoluto < 1. Portanto lim r(v)/|v| = 0 e então f é diferenciável. 
v— 


Corolário 1. Toda função de classe C! é contínua. 


As vezes, como na demonstração a seguir, é mais conveniente tomar p = 
p(v) = r(v)/|v| e escrever p|v| em vez de r(v). Então a diferenciabilidade de f 
se exprime como 


n 


ð 
fla+rv- fa)= 5 of 


-œi + plv|, com lim o =0. 
v> 


i=l 
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Teorema 2. Sejam U C R”, V C R” abertos, f:U —> V uma aplicação cujas 
Jfunções-coordenada fı, ..., fı possuem derivadas parciais no pontoa € U, e 
g: V > R uma função diferenciável no ponto b = f (a). Então g o f : U —> R 
possui derivadas parciais no ponto a e vale 


algo f) so dg df 
OX; dyk Əxi í 


i=1,..sm, 
k=1 


onde as derivadas parciais relativas aos x; são calculadas no ponto a e as relativas 
a yk são calculadas no ponto b = f (a). 
Além disso, se f e g são ambas de classe Cl então g o f € Cl. 


Observação. No Capítulo 5 provaremos, mais geralmente, que se f e g forem 
diferenciáveis então g o f é diferenciável. 


Demonstração. Podemos escrever 


a) 
efa) sia) = Y Soldas re) = fa] 


k=1 əy 


+ o(t) |f (a+ tei) — f(a)| 


onde, por simplicidade, escrevemos p(t) em vez de p(v) com v = f(a + tei) — 
f(a). A diferenciabilidade de g nos dá lim p(t) = 0. Então 
f=. 


n 


g(f (a+ tei))— g(F(a)) = y dg fila +tei) — frla) 


t 9 t 
EN Matteo Hm) l 
Logo 
go f) ESA rt) efa) sm dg 9h 
dx; k>0 t g Oy OX; 
k=1 
pois 
Cn Ha+rte)- fa) [df 
lim pt)=0e lim ; Er (a) à 


O fato de que g o f € C! decorre da expressão de 9(g o f)/0x; em termos das 
derivadas parciais de g e das fg, que são contínuas. 
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O gradiente de uma função diferenciável f : U —> Rnopontoa e U éo vetor 


ð ð 
grad f (a) = (Lo, T Lo) ; 


Se v é qualquer vetor de R”, a derivada direcional de f no ponto a, na direção 
de v é, por definição, 


of . f(a+tv)- f(a) 
— (a) = lim . 
dv t>0 t 

Estas definições permitem enunciar os seguintes corolários da Regra da Cadeia. 

O primeiro deles mostra que, quando f é diferenciável no ponto a, a derivada 
MEE 9 7 E 
direcional aa existe em relação a qualquer vetor v, dá uma expressão para 
v 


essa derivada em termos das derivadas parciais de f e das coordenadas de v e, 


ð 
finalmente, mostra que, na definição de EA (a), em vez do caminho retilíneo t => 
v 
a + tv, pode-se usar qualquer caminho à : (—ô, 8) —> U desde que se tenha 
A(O) = a e à’ (0) = v. O Corolário 3 é, na realidade, um importante teorema. 


Corolário 2. Seja f : U — R diferenciávelno aberto U C R”, coma E U. Da- 
do o vetor v = (1, ..., Œn), sex: (—ô8, ô) —> U é qualquer caminho diferenciável 
tal que MO) = a e A(O) = v, tem-se 


3 KE) 
(fo àY (0) = (grad f(a), v) = (a) = x a) aj. 


i=l 
Basta aplicar diretamente a fórmula 
” ðf da; 
ay = — - —, 
g ° ) ps dx; dt 


dA; 
observando que, para A(t) = (A(t),..., An(t)), tem-se a; = a S Notar ainda 
d 
que Ta) = (f o àY (0) com à (t) = a + tv, pois à’ (0) = v. 
v 


Corolário 3 (Teorema do Valor Médio). Dada f : U —> R diferenciável no 
aberto U C R”, se o segmento de reta la, a + v] estiver contido em U então existe 
0 e (0, 1) tal que 


fla +v) — fa) 


La + 0v) = (grad f(a + 0v),v) 


>P E 


0X; 
i=1 E 
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onde v = (01,...,4n). 


Com efeito, considerando o caminho retilíneo À : [0,1] — U, dado por A(t) = 
a + tv, vemos que f(a + v) — f(a) = (fo à)(1)— (f o AJ(O). Pelo Teorema 
do Valor Médio para funções de uma variável real, existe O e (0,1) tal que (f o 
2)(1) — (f o A)(0) = (f o À)'(0). Pela Regra da Cadeia, 


f) [à 
(foy (0) = >, SL (a + 00) a; = (a +00) = (grad f(a 400), v). 


Corolário 4. Seja f : U — R diferenciável no aberto U C R". Seo segmento de 
reta [a, a + v] estiver contido em U e existir M > 0 tal que | grad f (a + tv)| < M 
para todo t € [0, 1] então |f (a + v) — f(a)| < M - |v]. 


Com efeito, pela desigualdade de Schwarz, 
|f (a+ v) — f(a)] = | (grad f(a + 0v),v)| < | grad f(a + Ou] jul < M: |v]. 


Em particular, se U é convexo, f é diferenciável e | grad f (x)| < M para todo 
x € U então |f (y) — f (x)| < M|x — y| quaisquer que sejam x, y E U. 


Corolário 5. Seja f : U —> R diferenciável no aberto U C R". Se U é conexo e 
grad f(x) = O para todo x € U então f é constante. 


Com efeito, pelo Teorema do Valor Médio (Corolário 3), f é constante ao longo 
de todo segmento de reta contido em U. Ora, sendo o aberto U conexo, dois quais- 
quer de seus pontos podem ser ligados por um caminho poligonal (justaposição de 
segmentos de reta) contido em U. 

Dada f : U —> R de classe C!, o conjunto fc) = {x e U; f(x) = c} é, 
para todo c € R, chamado o conjunto de nível c da função f. Quando U C R” 
en = 2 esse conjunto é geralmente chamado a curva ou linha de nível c de 
f, a qual é definida pela equação f(x,y) = c. Analogamente, quando n = 3, 
o conjunto f~! (c), definido pela equação f(x, y, z) = c costuma ser chamado a 
superfície de nível c da função f. Deve-se observar porém que, para certas funções 
especialmente escolhidas, tais conjuntos podem ser bem diferentes daquilo que se 
imagina como uma curva ou uma superfície. 

Mencionaremos a seguir algumas propriedades do gradiente. Elas justificam 
a importância desse vetor, o qual dá interessantes informações sobre o comporta- 
mento da função. 

Para isto, fixaremos a € U e suporemos que grad f (a) £ O. Então: 


1) O gradiente aponta para uma direção segundo a qual a função é crescente; 
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2) Dentre todas as direções ao longo das quais a função cresce, a direção do 
gradiente é a de crescimento mais rápido; 


3) O gradiente de f no ponto a é ortogonal ao conjunto de nível de f que passa 
por a. 


Vejamos o que significam estas afirmações. 
Em primeiro lugar, pondo w = grad f(a) temos 


af 
zg © = (grad f(a), w) = | grad f (a)? > 0. 

Isto quer dizer que se À : (—£, £) > U é tal que à € C!, A(0) = a e à’ (0) = 
grad f (a) então a função t H> f(A(t)) tem derivada positiva no ponto t = 0. Logo, 
diminuindo € se necessário, f o à : (—€£, £) —> R será uma função crescente. É 
este o significado de “ f cresce na direção do gradiente.” 


an (x) 


L N 


Figura 1. 


Como df/dv = (grad f, v), os vetores v que apontam para as direções ao 
longo das quais f cresce são aqueles para os quais se tem (grad f, v) > 0, isto é, 
aqueles que formam um ângulo agudo com grad f(a). Dizer que o crescimento 
de f é mais rápido na direção do gradiente significa o seguinte: se v € R” é tal 
que |v| = | grad f (a)| então 


af af 


m eara 


Com efeito, pela desigualdade de Schwarz: 


of 
Jv (a) 


(grad f(a), v} < | grad f (a)| - |v] 


2_ of 
| grad f(a)|" = aT) (a). 
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Esclareçamos agora a terceira das afirmações acima. 

Dizer que w € R” é ortogonal ao conjunto de nível f~! (c) significa que, dado 
qualquer caminho À : (—£, £) —> f-!(c), diferenciável no ponto £ = 0, com 
A(O) = a, tem-se (w,A'(0)) = 0. Ora, A(t) E f!(c) significa que f(A(1)) = c 
para todo t € (—€, £), portanto fo A: (—€, €) —> R é constante, igual a c, logo 
(f o A) (0) = 0, ou seja (grad f (a), A'(0)) = 0. 

Assim, grad f (a) é ortogonal ao vetor velocidade no ponto a = A(0) de qual- 
quer caminho diferenciável À contido no conjunto de nível f7! (c). 

Ficam portanto constatadas as três propriedades do gradiente acima enunciadas. 
Vejamos agora alguns exemplos simples. 


Exemplo 2. Sejam f, g,h : R? —> R definidas por f(x,y) = ax + by (com 
a? +b? £ 0), g(x, y) = x? + y? e h(x, y) = x? — y?. A linha de nível c de f 
é a reta definida pela equação ax + by = c. O vetor grad f(x, y) é constante: 
grad f = (a, b) em qualquer ponto (x, y) € R?. Assim as linhas de nível de f 
são retas paralelas umas às outras, todas perpendiculares ao vetor v = (a, b). 

O conjunto de nível c da função g(x, y) = x? + y? é vazio se c < 0 e reduz-se 
ao ponto O € R? quando c = 0. Para c > 0, a linha de nível c é a circunferência 
de equação x? + y? = c, cujo centro é a origem e cujo raio é /c. O gradiente de 
g é grad g(x, y) = (2x, 2y), um vetor colinear com o raio, o que era de esperar 
pois a tangente da circunferência é perpendicular ao raio no ponto de contacto. 

A linha de nível O da função A(x, y) = x? — y? é o par de retas perpendiculares 
definidas pela equação x? — y? = 0, que equivale a “x + y = 0 ou x — y = 0”. Se 
c > 0, x? — y? = c define uma hipérbole cujo eixo é o eixo das abcissas; se c < O 
a hipérbole x? — y? = c tem como eixo o eixo das ordenadas. O gradiente de A é 
o vetor grad h(x, y) = (2x, —2y). Atribuindo valores particulares a x e y, vemos 
que este vetor é perpendicular à curva de nível que passa em (x, y) e aponta na 
direção de crescimento de h. < 


Chama-se ponto crítico de uma função diferenciável f : U —> R um ponto 
a € U tal que grad f (a) = 0. 

A função f do Exemplo 2 não possui ponto crítico. As funções g e h do mesmo 
exemplo têm a origem como ponto crítico. Nota-se em ambos os casos uma quebra 
de regularidade na disposição das curvas de nível quando se atinge um nível em 
que há ponto crítico. 


3 O Teorema de Schwarz 


o) ð 
Seja f : U —> R uma função que possui as derivadas parciais LE he 9) 
1 Xn 
em todo ponto x do aberto U C R”. A j-ésima derivada parcial da função 
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x, y) 
(2x, - 2y) 
x? -y? =€ 
Figura 2. 
of pt 
3 : U — R no ponto x € U será indicada por 
Xi 


p 
aa o = (57) (5 i j=1,...,n. 
0X; 


0X; OX; Ox; 


Se essas derivadas parciais de segunda ordem existirem em cada ponto x € U, 
92 


teremos n°? funções : U —> R. Quando tais funções forem contínuas, 


x;0X; 
J F 
diremos que f é de classe C? e escreveremos f € C°. 
Em geral, a mera existência das derivadas parciais de segunda ordem em todos 
os pontos onde f está definida não assegura que se tenha 


02 f 02 f 


ðxjðxi T Əxiðxj ? 


como se vê no exemplo abaixo. 


xy? — y?) 


Exemplo 3. Seja f : R? > R definida por f(x, y) = = T 
xX y 


quando x? + 
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y? # 0e f(0,0) = 0. Para todo y O tem-se f (0, y) = 0, logo 


of Oy) ye? -— y?) 
> = |m 
X 


P y) z mi x>0 x2 + y? AD 
Portanto 
3f ə (əf 
(0,0) = — ( = 0, y) | =—1. 
ðyðx dy À ox 
92 92 92 
Um cálculo análogo mostra que f (0,0) = 1. Logo f (0,0) Æ f (0,0). 
Əxðy ðxðy ayax 


Em todo ponto x € U onde existem as derivadas parciais de segunda ordem 
2 


da função f : U —> R, os números h;i; (x) = (x) formam uma matriz 


Ox; 0X; 
h(x) = [Ai; œ], chamada a matriz hessiana da função f. O Teorema de Schwarz 
afirma que se f é de classe C? então a matriz hessiana de f é simétrica. 

A demonstração do Teorema de Schwarz se baseia num resultado, atribuído a 
Leibniz, segundo o qual é permitido derivar sob o sinal de integral, desde que o 
resultado da derivação seja uma função contínua. Por sua vez, a demonstração do 
Teorema de Leibniz utiliza o lema abaixo, que poderia estar no Capítulo 1 mas é 
colocado aqui para deixar claro como cada proposição depende da anterior. < 


Lema 1. Sejam X C R” um conjunto arbitrário e K C R” compacto. Fixemos 
xo € X. Se f : X x K — R? é contínua então, para todo € > O dado, pode-se 
obter ô > 0 tal que x € X e |x — xo| < ô implicam | f (x, t) — f (xo, t)| < £, seja 
qual fort € K. 


Demonstração. Do contrário existiriam € > O e seqüências de pontos x, € 
X etk e K tais que |xi— xo] < 1/k e |f(xk,tk)— f (xo, tp)| > e. Pas- 
sando a uma subseqüência, se necessário, podemos admitir que lim tz = tọ € 
K. Como, evidentemente, lim x, = xo, a continuidade de f nos daria € < 
lim |f (xk, tk) — f (xo, tk)| = | f (x0, to) — f (xo, to)|, uma contradição. 


Teorema 3 (Derivação sob o sinal de integral). Dado U C R” aberto, seja 
ð 

f: U x [a,b] contínua, tal que a i-ésima derivada parcial a, t) existe para 
x: 


todo ponto (x,t) € U x [a, b] ea função df/0x;: U x [a, b] — R, assim definida, 
é contínua. Então a função  : U — R, dada por (x) = Ji f(x, dt, possuiai- 
dq of 
G= 


0X; E dx; 
suma: pode-se derivar sob o sinal de integral, desde que o integrando resultante 


seja uma função contínua. 


ésima derivada parcial em cada ponto x € U, sendo (x, )dt. Em 
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Demonstração. Pelo Teorema do Valor Médio para funções de uma variável, se x 
ex + se; pertencem a U então existe 0 e (0, 1) tal que 


Petra. fi x. ide 


S 


o f [eH = 1001) af 
= a S Ox; 


b 
[fermo ua 
a Lôx; əxi 


Pelo Lema, dado € > O arbitrariamente, podemos achar ô > O tal que 


(x, J dt 


E 
nt) — a. t)| < p-a? 
seja qual for t € [a, b]. Então |s| < ê implica 
pete -p0) -f r 
S əxi 
o que demonstra o teorema. 
92 f 3? f 


Teorema 4 (Schwarz). Se f : U —> R é de classe C? então = ; 
0X;0X; 0X; OX; 


Demonstração. Sem perda de generalidade, podemos supor que U = I x J éum 
retângulo em R?. Fixando b € J, o Teorema Fundamental do Cálculo nos diz que, 
para todo (x, y) € U, tem-se 


fe n= fa, nef Z Ui pan 


Como 92 f/9x dy é contínua, podemos derivar sob o sinal de integral, logo 


y 32 
La, e Lant | 2 f -Œ Ddr. 
b 


Em seguida, derivamos em relação a y e obtemos 


3? f 21 
3yəx x, y) = 


ms y). 
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Mais geralmente, para cada inteiro k > 1, podemos considerar as derivadas 
parciais de ordem k de uma função f : U —> R, definida no aberto U C R”. Por 
exemplo, para 


9 3a (8 
I<ijk<n, = significa f (a). 
ƏxiðxjðXk Əxi À O0x;0x 
Como toda permutação dos índices i,, ..., ix pode ser obtida por meio de repetidas 
inversões de índices adjacentes, segue-se do Teorema de Schwarz que a derivada 
de ordem k 


If 


əðXi əxi, Tu əXi, 


(a) 


não depende da ordem em que são feitas as derivações, desde que todas as derivadas 
de ordem k de f existam e sejam contínuas. 

Uma função f : U — R que possui, em cada ponto de U, todas as derivadas 
parciais de ordem k, as quais são funções contínuas em U , chama-se uma função de 
classe C*. Escreve-se então f € C*. Quando f € C* para todo k = 1,2,3,..., 
diz-se que f é uma função de classe C™. 


4 A fórmula de Taylor 


A fórmula de Taylor, que estabeleceremos aqui em sua versão restrita aos termos 
de até segunda ordem, é fundamental para o estudo do comportamento de uma 
função de classe C? na proximidade de um ponto crítico. Ela se baseia no lema 
abaixo. 


Lema 2. Sejar: B > R de classe C 2 na bola aberta B C R”, de centro 0. 


dr 92r 
Se r(0) = O = E, = 0 para quaisquer i, j = 1,...,n, então 
i i J 
co r(v) 
lim -= 
v—> 0 lv] 


Demonstração. Sendo r : B —> R uma função de classe C! (portanto diferen- 
ciável) que se anula, juntamente com todas as suas derivadas ðr/ðx;, no ponto 
v = 0, segue-se da definição de função diferenciável que lim r(v)/|v| = 0. Pelo 
Teorema do Valor Médio (Corolário 3 do Teorema 2), para cada v = (01,..., œn) € 
B existe 0 tal que 0 < 0 < 1e 


n n ðr 
dr r(v) da ©) O; 
r(v) = > Ed -Q;, logo TP = ) 2 


i=l y i=l 


jul jul 
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Como cada derivada parcial dr /dx; se anula, juntamente com todas as suas deri- 
vadas 92r/ 9x;0x;, no ponto 0, resulta da nossa observação inicial que 


9 
im | ev) / ul =0 para todo i=1,...,n. 
v>0| dx; 


Além disso, cada quociente œ; / |v| tem valor absoluto < 1. Por conseguinte 
Gs 


Mm — = 
v>0 ju? 


Teorema 5 (Fórmula de Taylor). Seja f : U —> R de classe C? no aberto U C 


R”. Fixadoa € U, para todo v = (&œi,..., œn) ER" tal quea+v eU, 
escrevamos 
n af 1 n 3f 
fa+v)- fa) = 2 o > gao OURO, 
: -p r) 
as derivadas sendo calculadas no ponto a. Então lim we =0 
P> v 


Demonstração. De acordo com o Lema, devemos demonstrar que 


n 9 1 n 32 
rw) = f(a+v)- fa- 5 Das D i 
i LARA 


i=1 ijj=1 


AA; 


se anula, juntamente com suas derivadas parciais de primeira e segunda ordem, no 
ponto v = 0. 

Para fazer o cálculo, começamos lembrando que, na expressão de r(v), as 
variáveis independentes são as coordenadas ct, ..., o de v. É em relação a elas 
que as derivadas parciais de r devem ser tomadas, embora continuemos escrevendo 
dr/0x; e 92r/0x;9x;. Observemos também que, no somatório duplo que ocorre 


na definição de r (v), cada par de variáveis q;, œj aparece em duas parcelas iguais, 
92 9? 
a saber, —— -« aja; e 
9X ; 0X; 0x;0X; 


w;%;. Levando isto em conta, temos: 


ər of of — df | 
OS a o 2 a O 


Derivando outra vez, vem: 


92r 9? 9? 
(v) = f (a+v)-— f 
0x;0X; 0X;0X j 0X;0X j 
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2 
Crue Cari 


Conseqüentemente r (0) = 0, 
0X; 0x;0X ; 


(0) = O para quaisquer 


Observação. Se pusermos p(v) = y quando v Æ 0 e o(0) = 0, a fórmula de 
v 


Taylor se escreve assim: 


fa+v)- fa) = D ds D BENTTE TE 
a l Lev]. , 
pr 2 TE dx; 


onde lim o(v) =0. 


5 Pontos críticos 


Uma forma quadrática H: > R” > R é uma função cujo valor no vetor 
n 
v=(01,...,0n)é >, hijaja;, onde [h;;] é uma matriz simétrica n x n. O valor 
i, j=1 
da forma quadrática H no vetor v será indicado com a notação H - v?. Portanto 


n 
H. v? = J hijæidj quando v= (or, e.’ On) . 
j=l 


Se t € R então H - (tv) = ê- H -v?. 

A forma quadrática H chama-se não-negativa quando H - v? > O para todo 
v € R?, positiva quando H - v? > O para todo v Æ 0 em R” e indefinida quando 
existem v, w € R” tais que H - v? > 0e H -w° < 0. De modo análogo se definem 
forma quadrática negativa e não-positiva. Quando H é positiva ou negativa, diz-se 
que ela é definida. 


Exemplo 4. A forma quadrática H : R” > R, onde H - v? = (v, v), é positiva. 
Como (v, v) = a? +... +a, a matriz de H é a identidade. Para todo k € [1,n], 
H . v? = af + --- + a? é uma forma quadrática não-negativa em R”. Por outro 
lado, se pusermos H .v? = of +: +a} — af, — e a? com0 <k <n, 


teremos uma forma quadrática indefinida. Evidentemente, se H é positiva (respect. 
não-negativa) então — H é negativa (respect. não-positiva). < 


Seja H : R” —> R uma forma quadrática cuja matriz é [A;;]. 

Se chamarmos de Ho : R” —> R” o operador linear cuja matriz na base canônica 
de R” é também [h,;;], vemos imediatamente que H - v? = (Ho-v,v) para todo 
v € R”. Como a matriz [h;;] do operador Ho na base canônica é simétrica, Ho é 
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auto-adjunto. Reciprocamente, para qualquer operador auto-adjunto Ho: R” — 
R”, a função H : R” —> R, dada por H - v? = ( Ho- v, v ), é uma forma quadrática. 
Quando H é definida, o operador H é invertível pois (Ho - v, v } Æ O para todo 
v Æ 0 => Ho -v Æ 0 para todo v Æ 0. 

Dada a função f : U — R, de classe C? no aberto U C R”, a forma quadrática 


hessiana H (x) de f no ponto x € U é aquela cuja matriz é [h;;] = | f w| 


Əxiðxj 
Assim, para todo v = (01,...,0n) € R”, tem-se 
2 Á É 
H(v).v = a TETA (x) - aja; 


ij=1 


P4 


A forma hessiana é usada para determinar a natureza dos pontos críticos da 
função f. 

Diz-se que a € U é um ponto de máximo local da função f : U —> R quando 
existe ô > Otal que f(x) < f(a) para todo x € U N B(a; 6). Analogamente se 
define um ponto de mínimo local. Um ponto a, de máximo (ou de mínimo) local 
de uma função diferenciável f, é um ponto crítico de f. Com efeito, para todo 
i=1,...,n,seô > Oé suficientemente pequeno então a função o : (—8, ô) > R, 
dada por (t) = f (a + tei), está bem definida e possui um máximo (ou mínimo) 


po 
local no ponto t = 0. Logo 0 = q'(0) = La, p= leM, 
Xi 


Exemplo 5. A origem 0 € R? é ponto crítico das três funções f, g, h : R? —> R, 
definidas por f(x, y) = x? + y°, g(x, y) = =x? — y? e h(x, y) = x? — y2. Para 
f, a origem é um ponto de máximo, para g de mínimo e para h não é máximo nem 
mínimo pois em qualquer disco de centro O a função h assume valores maiores e 
menores do que O = A(O, 0). < 


Teorema 6. Seja a € U um ponto crítico da função f : U > R, de classe C?. 


a) Se a forma quadrática hessiana H (a) for positiva então a é um ponto de 
mínimo local de f. 


b) Se H (a) for negativa então a é um ponto de máximo local. 


c) Se H (a) for indefinida, então a não é ponto de máximo nem de mínimo local 


de f. 


Demonstração. a) Por simplicidade, escrevemos H em vez de H (a). Pelo Teore- 
ma de Weierstrass, a função contínua positiva H assume um valor mínimo 2c > 0 
no conjunto compacto S”7!. Noutras palavras, existe c > O tal que H - u? > 2c 
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para todo vetor u € R” com |u| = 1. Como a é um ponto crítico de f, a fórmula 
de Taylor se resume a 


1 
Far) Ha)= 5H -v+ pt) ju? com lim p(v) =0. 


Como v / |v] é um vetor unitário (pertencente a S"-!), temos 


1 2 2 2 
ly. "Cy. a SAE RO 
[ul 2 


Portanto f(a + v) — f(a) > |v|? (c + o(v)). 

Pela definição de limite, existe ô > O tal quea +v e U e O < |v| < ô implicam 
lo@w)| < c e conseqüentemente c + p (v) > 0. Logo f(a + v) — f(a) > 0, isto 
é, f(a) < f(a + v) para todo v tal que a +v E€ U e0 < |v| < ô. Assim, a é um 
ponto de mínimo local para f. 

b) Segue as mesmas linhas do caso anterior. 

c) Dado v e R”, tem-se a + tv € U para todo + suficientemente pequeno. 
Então, lembrando que H - (tv)? = 42. H . v?, temos 


Hari) fla) =t- |v- [H -v+ ptv], com lim o(tv) =0. 


Segue-se, como acima, que para todo t suficientemente pequeno, f (a+tv)— f(a) 
tem o mesmo sinal que H - v?. Assim, se H é indefinida, com H -v? > 0e 
H - w? < 0, em qualquer bola de centro a existem pontos a + tv e a + tw tais 
que f(a + tv) > f(a)e fla+tw) < f(a). Portanto f não tem máximo nem 
mínimo local do ponto a. 


Corolário 6. Se a função f : U —> R, de classe C?, possui um mínimo (respect. 
máximo) local no ponto a € U então a forma quadrática hessiana de f é não- 
negativa (respect. não-positiva) nesse ponto. 


Com efeito, se fosse H-v < Opara algum vo € R”, teríamos f (a+tvo) < f(a) 
para todo ź suficientemente pequeno, e então a não seria um ponto de mínimo local. 
Mesmo argumento para máximo local. 


Exemplo 6. Pela demonstração acima, vê-se que quando a forma quadrática hes- 
siana é positiva (respect. negativa) no ponto a então a é um ponto de mínimo 
(respect. máximo) local estrito, isto é, numa pequena bola de centro a não há 
outros pontos x com f(x) = f(a). Por exemplo, a origem é um ponto de mínimo 
estrito da função f (x, y) = x? + y? mas todos os pontos (x, 0) do eixo das abcissas 
são pontos de mínimo não-estritos da função g(x, y) = y?. (O domínio de ambas 


SECTION 5: PONTOS CRÍTICOS 61 


as funções f, g é R?.) A forma hessiana de f na origem de R? é H - v? = 20º +28? 
se v = (a, B) enquanto a de g é K - v? = 202. Vemos que H é positiva e K é 
apenas não-negativa. Já a forma hessiana da função h(x, y) = x? — y? na origem 
éL.v? = 20º — 28º, que é indefinida. Por isso a origem é um ponto crítico que 
não é máximo nem mínimo local (ponto de sela). a 


Exemplo 7. Poder-se-ia indagar se vale a recíproca do corolário acima. A resposta 
é negativa. A função f : R? > R, dada por f(x,y) = x? + y? tem a origem de 
R? como ponto crítico, no qual a forma hessiana é H - v? = 20º, para v = (a, p). 
A forma H é não-negativa porém a origem não é um ponto de mínimo 
local de f. < 


Neste ponto, cabe a pergunta: de que modo podemos determinar se uma dada 
forma quadrática é positiva, negativa, etc? O método de completar o quadrado, 
devido a Lagrange, responde a questão. Este método, que se baseia na observação 
óbvia de que a? + 2ab = (a + b}? — b?, consiste em efetuar sucessivas mudanças 
de variáveis, visando eliminar, na expressão da forma quadrática H, os termos 
como xy, xz, yz, etc, deixando apenas parcelas do tipo x’, ps z? etc. 

Os exemplos a seguir ilustram o método de completar os quadrados. 


Exemplo 8. Seja a forma quadrática H (x, y) = x?-xy+y? em R?. Completando 
o quadrado, temos 


2 
Psy=r cds (r=5) = 


Logo 
2 2 2 3 
HG) =(x—5) «+ y=(r=5) +)". 


Portanto H (x, y) = s? +t? coms = x — y/2e t = 3/2-y. Assim, a forma H é 
positiva. O mesmo processo, aplicado à forma K, onde K (x, y) = x? + 3xy + y? 
nos dá 


Kay) = (x+? -n 
xy) =| xF q” Vo 


ou seja, 


K( ) 3 < 5 2 ARE. 3 7 
= zi —Íy = 5 — co s= = e = 
X,Y)= ARAY y = m SAY = 


Portanto a forma K é indefinida. < 
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Exemplo 9. Seja em R? a forma quadrática H (x, y, z) = x? + y? + z? + 3xy + 
3xz + 4yz. Agrupando os termos que contêm x, temos: 


3 3 ? 9 
x +3xy+3xz = vta jot [24504] = 00" 


9 9 9 3 
= po pd yr, com s=x+-0 +92). 


4 4 2 2 
Logo 
9 9 9 
H(x,y,0) = +y +z- a — é — ut Az 


5 5 1 
ME RES A 


Agrupando os termos que contêm y: 


Sa E E aaefa S la 
q 2 = 7 y zyz a y 5º 20º 
= S epep com t= y+=-z 
4 20 
Portanto: 
5 1 5 5 6 
H EN E A EEE E EO N A 
(x,y,z) =8s 4 + 50º q =] 5º 


Concluímos então que a forma quadrática H é indefinida. Com efeito, para z = O 
temos 


5 ss 
Ha O=- P= (2+3) = É 


Logo H(x,0,0) = x? e em particular, H (1,0,0) = 1, enquanto 
H(-3/2,1,0) = —5/4. < 


6 Funções convexas 


Seja C C R” um conjunto convexo. Uma função f : C —> R chama-se convexa 
quando, para quaisquer x, y e Cet € [0, 1], tem-se 


fA- tx+ty) s A-Hf +IFO). 
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Alternativamente: f é convexa quando, para quaisquer x, y e Cea, p E [0,1] 
com a + 8 = 1, tem-se f(ax + By) <a-f()+ B-f(y). 

Diz-se que f: C — R é côncava quando — f é convexa. Isto equivale a 
dizer que, para quaisquer x,y e Cet e [0,1] tem-se f((1I — t)x + ty) > 
(1 — DFf(x) + tf(y). Todos os resultados a seguir estabelecidos para funções 
convexas valem, com as óbvias modificações, para funções côncavas. 

A combinação linear œıvı + - -- + gv chama-se uma combinação convexa de 
vi,...,v; E R” quando œ; +: -: + œ; = 1 e g; > 0 parai = 1,...,k. 


Teorema 7. Se C e R” é convexo e vi,..., vg E C então toda combinação 
convexa avi +---+ av; pertence a C. Além disso, se f : C —> R é uma função 
convexa, tem-se 


k k 
f Do aivi < Dow f). 


i=l i=1 


Demonstração. Para k = 1 é óbvio e para k = 2 segue-se da definição de 
conjunto convexo que a combinação convexa de k elementos de C ainda pertence 
a C. Supondo este fato verdadeiro para um certo k, escrevamos uma combinação 
convexa dos elementos v4, ..., v;+1 E€ C sob a forma 


k+1 


k 
) divi = ) Ovi + GRAVA + 


i=1 i=1 


Sem perda de generalidade, podemos admitir que œz+ı Æ 1. Então, pondo œ = 
k 


>; qi, temos a; = 1 — g e œ 0. Pela hipótese de indução, levando em conta 
i=1 

k odi k o; 
que 5) — = 1, vemos que v = $` — v; pertence a C. Logo 


i=1 Q i=1 


k 
J Qvi = v + (1 — œ)vk+ı E C, pois C é convexo. 
i=l 


A segunda parte também se prova por indução, pois 


k+1 
f > aivi = f DO aivi + Arpi Vey 
i=1 i=l 
k 
Qi 
a a. JT t+ (l avii 


i=l 
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k 
<a-f ( 2 žu) + (1 — 0) f(vk+) 
i=l 
Ea k+l 
<a: e PEA + (1 — æ) f(v) = > a;i f (vi). 
i=1 


i=l 


Teorema 8. Seja C C R” convexo. A fim de que a função f: C > R se- 
ja convexa, é necessário e suficiente que, para quaisquer a,b € C, a função 
ọ : [0, 1] — R, definida por (t) = f(a + tv), v = b — a, seja convexa. 

Equivalentemente: f : C —> R éconvexa se, e somente se, sua restrição a 
qualquer segmento de reta [a, b] C C é convexa. 


Demonstração. Se f é convexa então, para s, t, œ € [0, 1] temos 


o(a — q)s + at) = f(a + [a — o)s + at |v) 


flA-— a) - (a +sv) +a. (a+tv)] 


IA 


(d —a)f(a+sv)+af(a+tv) 


A — odp(s) + g(t) 


logo q é convexa. 
Reciprocamente se todas as funções y, definidas do modo acima, são convexas 
então, dados x, y e Ce a € [0, 1], pomos (t) = f(x + t(y — x)) e temos: 


HMA -ox+ay) = f(xragy-s)=p()=p(1-0)-0+0-1) 


A-a) g0) +a- p0)= 0-a): fO)+ra: fY), 


IA 


portanto f é convexa. 


Como aplicação do Teorema 8, mostremos que se f : U — R é uma função 
convexa e o conjunto convexo U C R” é aberto então, para cada a € U, existe a 
derivada de Gâteaux 


of e fla + tv) — f(a) 
—— (a) = lim , 
dv+ 


t>0+ f 


Com efeito, a função q : [0,1] —> R, definida por (t) = f(a + tv) é convexa, 
portanto existe a derivada à direita q! (0) (veja Vol. 1, pág. 106). Mas, como se 


[o 
vê facilmente, q! (0) = a (a). 
v 
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Daí se conclui, como no Vol. 1, que toda função convexa definida num subcon- 
junto aberto de R é contínua. Este resultado continua válido em R” comn > 1 (ver 
Apêndice deste capítulo) porém não decorre da existência da derivada de Gâteaux, 
pois uma função em R” pode ser contínua ao longo de cada reta que passa por um 
ponto a sem que seja necessariamente contínua nesse ponto. 


Teorema 9. Seja f : U > R definida no aberto convexo U C R". Então: 


a) O conjunto E(f) = {(x,y) € U xR:y > f(x) CR", chamado o 
epigráfico de f, é convexo se, e somente se, f é convexa. 


b) Supondo-a de classe C!, a função f é convexa se, e somente se, para a, a + 
v € U quaisquer, tem-se 


f(a+v) > f(a) + (grad f(a), v). 


c) Quando é de classe C?, a função f é convexa se, e somente se, sua forma 
quadrática hessiana é não-negativa em todos os pontos de U. 


Demonstração. (a) Seja E(f) convexo. Para mostrar que f é convexa, tomamos 
x, x € U eae [0,1]. Então (x, f(x)) e (x', f(x”) pertencem a E(f), portanto 
(a —o)x+ax, (1-0): fœ) +a. f(x) € E(f). Isto significa que (1 — q) - 
fO)+ra- f(x) > f [a — q)x + ax'], logo f é convexa. Reciprocamente, 
supondo f convexa, sejam z = (x, y), x'(x',y) pontos em E(f) ea e [0,1]. 
Então y > f(x)ey' > f^) eda (1 -a)y +ay > (1-0): fœ) +a: f(x) > 
f (a — q)x + ax’), a última desigualdade devendo-se à convexidade de f. Logo 
1-a)z+az = (a —o)x + ax’, (1 —&)y + ay’) pertence a E(f), ou seja, 
E(f) é um conjunto convexo. 

(b) Suponhamos f : U —> R convexa, de classe C!. Pelo Teorema 8, se a e 
a+-v pertencem a U então a função q : [0,1] —> R, definida por y(t) = f(a-+tv), 
é convexa. Portanto (v. Teorema 4, pág. 106, vol. 1) tem-se q(1) > q(0) + q'(0). 
Mas q(1) = fla + v), p(0) = f(a) e (0) = (grad f(a), v}. Logo f(a +v) > 
Ff(a) + (grad f (a), v). Reciprocamente, suponhamos que esta igualdade valha 
para quaisquer a, a +v e U. Então, pondo q(t) = f(a + tv), temos uma 
função q : [0,1] > R tal que q'(t) = (grad f(a + tv), v) para todo t € TO, 1]. 
Ora, pela hipótese admitida sobre f, para quaisquer t, to € [0,1], f(a + tv) = 
f(a+ tov + (t — to)v) = f(a + tov + sv), com s = t — to, logo 


f(a+tv) > f(a+ tv)+ (grad f(a + tov), sv) 


f(a + tov) + (grad f(a + tov), v) (t — to) 
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o que pode ser lido como o (t) > (to) + q'(to)(t — to). Pelo Teorema 4, pág. 106, 
Volume 1, a função g é convexa. O Teorema 8, acima, assegura então que f é 
convexa. 

(c) Novamente, usamos o Teorema 8 acima, o qual permite reduzir a questão 
ao caso de uma função de uma variável, e então recaímos outra vez no Teorema 
4 da pág. 106 do Volume 1. Com efeito, pondo (t) = f(x + tv), com v = 
(g1,..., Œn), temos 


n n 2 


PD= > (ua; E Po 


i=1 i,j=1 


TAS aix; = H(x)- v. 


Temos portanto as seguintes equivalências: H (x) é não-negativa para todo x € 
U <-> ọ"(t) > 0 para quaisquer x, x +v € U et € [0,1] 4= todas as funções 
q do tipo y(t) = f(x + tv) são convexas <> f : U > R é convexa. 


Corolário 7. Todo ponto crítico a de uma função convexa f : U —> R de classe 
C! é um ponto de mínimo global, isto é, f(x) > f(a) para todo x € U. 


Apêndice: Continuidade das funções convexas 


Teorema 10. Seja U C R” um aberto convexo. Toda função convexa f : U —> R 
é contínua. 


A demonstração do Teorema 10 se baseia nos dois lemas abaixo. 


n 
Lema 3. Todo ponto de um bloco retangular B = || [a;, bi] é uma combinação 
i=1 
convexa dos vértices desse bloco. 


Demonstração: (Por indução). Isto é óbvio para n = 1. Sejan > 1. Os vértices 
n 
do bloco B são os 2” elementos do conjunto |] (a;, bi}, os quais denotaremos 


i=l 

por v; ou v; conforme sua última coordenada seja da forma ag ou bg. Um ponto 
arbitrário do bloco B pode ser escrito como p = (x, y), onde y € [an, bn] ex 

n 
pertence ao bloco B’ = [| [a;, bi], de dimensão n — 1. Pela hipótese de indução, 

i=l 
x = J aj;u; é combinação convexa dos vértices u; € B’. Os vértices de B 
são vj = (uj, an) e Vj = (uj, ba). Pondo po = (x, an) e pı = (x, bn), temos 
Ppo=>Dajviep = } «jU; (jáque q; = 1). Além disso, y = (1 —t)an, +tbn, 
com 

Y— an 
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logo 

p=U-Dpo+tp=5 0-Da;v;+D tajt, 
o que exprime o ponto arbitrário p do bloco B como combinação convexa dos 
vértices de B. 


Lema 4. Toda função convexa f : U —> R, definida num aberto convexo U C R”, 
é localmente majorada por uma constante. 


Demonstração. Seja A = J] (a;, bi) o interior de um bloco retangular contido em 
i=1 

U. Se indicarmos com wj, j = 1,...,2”,os vértices de A teremos, para cada x € 

A, x = > «;w; logo, pela convexidade de f, f(x) <> a;: f(w;) < M, onde 

M = max {f (w). 


Demonstração do Teorema 10. Para simplificar a escrita, a fim de provar a con- 
tinuidade de f no ponto arbitrário a € U, podemos admitir que a = O e que 
f(0) = 0, pois o conjunto Uo = {x € R”;a — x e U} é aberto, contém O e a 
função g : Uo —> R, definida por g(x) = f(a — x) — f(a), cumpre g (0) = 0, é 
convexa e é contínua no ponto O se, e somente se, f é contínua no ponto a. Pelo 
Lema 4, existem c > 0e M > 0 tais que |x| < c => f(x) < M. Seja dado € > 0. 
Sem perda de generalidade, podemos supor que € < M. A convexidade de f nos 
permite afirmar que 


logo 


Ec 
Tomando ô = Ta vemos que 


lx EC M 
x| < — = |> x 
M E 


ce f (Zx) su = fŒ se. 


Além disso, 


© 
Il 
+ 
S 
| 

+ 
E 

+|E 
= 
dE 
E 

==) Sô 
q 

| 
o |E 
es 
xe 
Se 
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Simplificando, vem M - f(x) + e: f(—-Mx/e) > 0, donde: 
1625 Cf(Mx/e)) > È (M) = e. 


Em resumo: |x| < ce/M = —e < f(x) < e, logo f é contínua no 
ponto 0. 


Capítulo 4 


Funções Implícitas 


1 Uma função implícita 


Os pontos de R”+! serão escritos sob a forma (x, y), onde x = (X,,...,xn) € R” 
ey € R. O teorema abaixo dá significado preciso à afirmação de que “a equação 
f(x, y) = c define implicitamente y como função de x” e estabelece uma condição 
suficiente para que ela seja verdadeira. 


Teorema 1 (Teorema da Função Implícita). Dada a função f:U > R, de 
classe C*(k > 1) no aberto U C R"+!, seja (xo, yo) € U tal que f(xo, Yo) = € 
o 
e zy 0» yo) Æ O. Existem uma bola B = B(x9; ô) e um intervalo J = (yọ — 
y 


€, Yo + £) com as seguintes propriedades: 


= ə 3 
1) Bx J c U e ŽL, y) # O para todo (x, y) € B x J; 
y 


2) Para todo x € B existe um único y = &(x) € J tal que f(x,y) = 


fœ, E&x) =. 


A função £ : B —> J, assim definida, é de classe C* e suas derivadas parciais 
em cada ponto x € B são dadas por 


ə -L (x, E(x)) 
ix O TA 
Oyo? 


ə 
Demonstração. Para fixar as idéias, admitiremos que Le, yo) > 0. Pela con- 
tinuidade de df/0y, existem ô > O e £ > O tais que, pondo B = B(x9,6) C R” 
- ð 
e J = (yo — £, yo + £) C R, temos BxJ CU e Ea, y) > 0 para todo 
y 
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(x,y) € B x J. Então, para todo x € B, a função y > f(x, y) é crescente no 
intervalo [yo—s, yo+ E] = J. Como f (xo, Yo) = c, segue-se que f (xo, Yo—E) < c 
e f(xo, yo +£) > c. Sendo f contínua, podemos supor ô tão pequeno que 
f(x, yo— £) < ce f(x, yo+ £) > c para todo x € B. Pelo Teorema do Valor 
Intermediário, para cada x € B, existe um único y = (x) € J talque f(x,y) = c. 
Tem-se necessariamente y € J. Mostremos que a função £ : B —> J possui 
derivadas parciais em todo ponto x € B. 


Figura 1. 


Com efeito, pondo k = k(t) = E(x + tei) — E(x), vem E(x + tei) = E(x) + k, 
logo f(x + tei, E(x) + k) = f(x, E(x) =c. 
Pelo Teorema do Valor Médio, para todo t existe O = 0 (t) e (0, 1) tal que 


O = faæ+tei EO) +k- f, EQO)) 
= U poene E rins dd dd 
əxi əy 


Logo 


Ette- EM) ko Otote E) +06) 


t to Taste Ex) + 0k) ` 


Neste ponto, admitamos a continuidade de &, que será provada abaixo. Então 
lim k(t) = 0. A continuidade das derivadas parciais de f nos dá então 
t- 


5 Etta) -E AEEA) 
— (x) = lim = — 


COB za o A < i < n) e 
ox; 150 t Tao 
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A expressão de 3£/ðx; mostra que se f e C% então 9E/0x, € CH! para 
i=1,...,n, portanto É € ct. 


Demonstração da continuidade de é 


Pelo Teorema 19 do Capítulo 1 (v. observação que o segue), basta mostrar que, 
para todo conjunto fechado F C J, a imagem inversa &!(F) é fechada em B. 
Ou seja: se a sequência de pontos x, e B é tal que &(x;) € F para todo k E Ne 
lim x, = x € B então, E(x) e F. Ora, F é compacto, logo uma subseqiência de 
pontos x, € B étalque lim é(x,) = a € F. Logo f (x, a) = lim f(x,, E(x,)) = c. 
Mas f(x, E(x)) = c. Pela unicidade de E (x), segue-se que E(x) = a E F. 


Considerando o aberto V = B x J c R”+!, o teorema acima diz que, nas 
condições das hipóteses, tem-se 


fHONV = (4,80) E R"; x e B}. 
Noutras palavras, f7! (c) N V é o gráfico da função £ : B> R. 
Observação. Evidentemente, não há nada de especial quanto à última coordenada, 
exceto simplificar a escrita na demonstração. Se, para algum inteiro i € [1, n + 1], 
tivermos Lo) Æ 0 onde zo € U e f(zo) = c, existirá um aberto V > zo, tal 


que, para z € V,aequação f(z) = c definirá x; = E(X1,...,Xi-1, Xi+l; <- Xn+1) 
como função das outras n coordenadas e f~! (c) N V será o gráfico dessa função 
E, de classe C*. De um modo geral, se grad f (zo) # 0 e f (zo) = c então existe 
V > zo aberto tal que f!(c)N V é o gráfico de uma função real de n variáveis, 
de classe C*. 


Exemplo 1. Seja f : R? —> R definida por f(x,y) = x? + y?. Para todo (x, y) € 
ð 
R?, temos FRA y)=2x e pA y) = 2y. A equação x? + y? = c define o 
x 


conjunto vazio quando c < 0. (O Teorema 1 não se aplica, pois não existe o ponto 
(xo, Yo) tal que f (xo, yo) = c.) Quando c = 0, a equação x? + y? = O é satisfeita 


ð 
apenas quando x = y = 0. (Agora existe (xo, Yo) mas o, 0) = 33 0: 0) = 0.) 
x y 
Quando c > 0, a equação x? + y? = c define a circunferência de centro na 
origem e raio ./c, a qual não é gráfico de função alguma do tipo y = E(x) nem 
x = ġ (y), pois há retas verticais e horizontais que a cortam em dois pontos. Mas, 
se considerarmos os abertos 
V! = {(x, y) € R?; y > 0}, V? = {(x, y) € R?; y < 0}, 
V? = {(x, y) € R?; x > 0}, V* = {(x, y) € R°; x < 0}, 
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veremos que f!()NV! e f!(c)NV, são gráficos das funções £, éz : (—1, 1) — 
R, dadas por & (x) = V1 — x2,E(x) = —V1 — x2, enquanto ff M()NV; e 
fc) N V4 são os gráficos de 3, £4 : (—1, 1) —> R, dadas por &(y) = y1 — y? 
e &(y) = —y 1 — y?. Assim, em V; e Vz a equação x?+y? = c (comc > 0) define 
implicitamente y como função de x enquanto em V3 e V4 define x como função de 
y. Evidentemente, salvo na vizinhança dos 4 pontos (+c, 0), (0, +./c), tem-se 
a opção de tomar y como função de x ou x como função de y. < 


2 Hiperfícies 


Um conjunto M C R”+! chama-se uma hiperfície de classe C* quando é localmente 
o gráfico de uma função real de n variáveis de classe C*. Mais precisamente, para 
cada p € M deve existir um aberto V C R”+! e uma função é : U — R, de classe 
C* num aberto U C R”, tais que p € V e V N M = gráfico de £. 

A afirmação “V N M = gráfico de €” significa que, para um certo inteiro 
i € [1,n], tem-se 


1. 
VAM = {(x1,..., Xn4+1) € R”+ A EEN eec A kiise Anaa) ye 


Evidentemente, dada qualquer função f : U —> R de classe C* no aberto 
U C R’, seu gráfico é uma hiperfície M = {(x, f(x) € R”+!; x € U} de classe 
Cr 

Quando n = 1, uma hiperfície em R? chama-se uma curva e, quando n = 2, 
tem-se uma superfície em Rº. 


Exemplo 2. A esfera S” = [x e R”+!; (x, x} = 1) éumahiperfície C em R”+!., 
Com efeito, chamando de U a bola aberta de centro O e raio 1 em R”, pondo, para 
cadai=L..o,n+tLV=(xeRtx>O,W=lxeRTx<o0Oe 
escrevendo x* = (Xx1,...,Xi-1, Xi41,..-, Xn+1), temos: 


xesSínvV; +s |xX|<l e x=vV1-(x*,x*): 
xe S AW es |x|<l e x=-Vl-(x*,x*). 


Logo, considerando a função é: U —> R, de classe CN, definida por 
E(u) = 1 — (u,u), vemos que, para cada i = 1,...,n + 1, S” N V; é o gráfico 
da função x; = &(x*) enquanto que S” N W; é o gráfico de x; = —&(x*). Como 
todo ponto p e S” pertence a algum V; ou a algum W;, concluímos que S” é uma 
hiperfície de classe CS em R”+!, 

Seja M C R"*! uma hiperfície de classe C*(k > 1). A cada ponto p € M 
associaremos o conjunto 7,M, formado por todos os vetores-velocidade v = A'(0) 


dos caminhos À : (—ô, ô) —> M que são diferenciáveis no ponto O e cumprem a 
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condição À (0) = p. O conjunto T, M é chamado o espaço vetorial tangente de M 
no ponto p. Esta denominação se justifica pelo < 


Teorema 2. T,M é um subespaço vetorial de dimensão n em R'*1, 


Demonstração. Seja : U —> R uma função de classe C* no aberto U C R”, cujo 
gráfico, formado pelos pontos (x, E(x)) € RHlxeU,éa interseção MNV, onde 
V cC R”+! é um aberto que contém p = (po, E(po)), po € U. Para todo caminho 
à : (—ô, ô) > M, com A(O) = p, tem-se A(t) = (x1 (t), ..., xn(t), E(x(t)), onde 
x(t) = (xı (t), ..., Xn (t)). Portanto 


; dx1 di < ðE dx; 
A(O) = KRA ; s $ 
(0) dt dt A dx; dt ) 


i=l 


as derivadas dx;/dt sendo calculadas no ponto t = 0 e d$/0x; no ponto po. Isto 
mostra que todo v = A'(0) em T,M é uma combinação linear dos vetores vı = 
(1,0,...,0,08/0x1),..., vn = (0,...,0,1, 08/0x,). (Derivadas no ponto po.) 
Reciprocamente, toda combinação linear v = J` a;v; é o vetor-velocidade A’ (0) 
i=l 
do caminho À : (—ô, ô) — M assim definido: tomamos vo = (w1,...,an) E€ R” 
e pomos à (t) = (po + tvo, (po + tvo)), sendo ô > O escolhido de modo que o 
segmento de reta (po, —ôvo, po + óvo) esteja contido em U. 


Observação. Como subespaço vetorial de R"*!, o espaço vetorial tangente T, M 
contém a origem O € R”+! e não contém necessariamente o ponto p, embora nas 
figuras ele apareça passando por p. Ocorre que, nas ilustrações, o que se vê é a 
variedade afim p + T,M, paralela a T,M por p. 


Exemplo 3. O espaço vetorial tangente T, S” é, para todo p € S”, o complemento 
ortogonal de p, isto é, o conjunto [p]! de todos os vetores v € R”+! tais que 
(v,p) = 0. Com efeito, sendo T,S” e [p]* ambos subespaços vetoriais de 
dimensão n em R”*!, para mostrar que eles coincidem, basta provar que T,S” C 
[p]+. Ora, se v € T,S" então v = à'(0), onde à : (—ô, ô) —> S” é um caminho 

d 
FARA A()) = 
2(A'(0), A(0)) = 2(0, p). < 


diferenciável no ponto 0, com A(0) = p. Neste caso, O = 


A seguir, apresentaremos um critério bastante útil para dar exemplos de hiper- 
fícies. 

Um número c e R chama-se um valor regular de uma função f : U > R, de 
classe C!, quando não há pontos críticos de f no nível c, isto é, quando f(x) = 
c > grad f(x) £ 0. Diz-se também que c é um nível regular de f. Quando existe 
x € U tal que f(x) = c e grad f(x) = 0, diz-se que c é um nível crítico de f. 
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Figura 2. 


Teorema 3. Se c é um valor regular da função f : U —> R, de classe C* no aberto 
U cR"*,entãoM = f~! (c) é uma hiperfície de classe C*, cujo espaço vetorial 
tangente T,M é, em cada ponto p € M, o complemento ortogonal de grad f (p). 


Demonstração. O fato de que f7! (c) é uma hiperfície é apenas uma reformulação 
verbal do Teorema da Função Implícita. (Ver Observação após a prova do Teorema 
1.) Quanto ao espaço vetorial tangente T,M, como M é uma superfície de nível 
da função f, vemos que todo vetor v € T,M é ortogonal a grad f(p), logo 
T;M C [grad f( p)J-. Sendo ambos subespaços de dimensão n em R”+!, conclui- 
se que T,M = [grad f(p)J-. 


P4 


Exemplo 4 (Mais uma vez a esfera). À luz do Teorema 3, a esfera unitária S” é 
a superfície de nível 1 da função f : R”+! —> R, dada por f(x) = (x, x). Como 
grad f(x) = 2x, vemos que zero é o único nível crítico de f. Em particular, 1 
é valor regular e S” = f7!(1) é uma hiperfície C% e, para todo p € S”, tem-se 
TS” = [grad flip) = [p]. < 


Exemplo 5. Seja A : R” —> R” um operador linear auto-adjunto. A função 
f: R" > R, definida por f(x) = (A-x,x) é o que se chama uma forma 
quadrática. Se [a;j] é a matriz (simétrica) de A na base canônica de R” en- 
tão f(x) = 5) aijxixj. Logo ðf/ðx; = 2 J` aijx; e consequentemente 
i,j=1 j=l 
grad f(x) = 2A - x. Supondo agora que o operador A seja invertível, o único 
ponto crítico da função f é a origem 0, onde f assume o valor zero. Então, para 
todo c Æ 0 a equação f(x) = c define uma hiperfície. Costuma-se tomar c = 1 e 


a hiperfície definida pela equação f(x) = 1, ou seja, >) a; ;X:X; = 1, chama-se 
ij=1 
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uma quádrica. Em particular, se o operador A é positivo, isto é, se f(x) > O para 
todo x Æ 0, a quádrica f7!(1) chama-se um elipsóide. < 


Exemplo 6. Seja f : R? > Ra função que associa a cada matriz x = [x;;] de n 
linhas e n colunas seu determinante f(x) = det x. O desenvolvimento de Laplace 
nos dá 


fO= > Dix Xi, 
j=l 


onde o ij-ésimo menor X;; é o determinante da matriz (n — 1) x (n — 1) que 
se obtém de x omitindo a i-ésima linha e a j-ésima coluna. Segue-se daí que 


—— (x) = (— 1) X;;. Em particular, se x = I = matriz identidade n x n, temos 


ij 
La) = 6; (delta de Kronecker, igual a 1 quando i = j e O quando i Æ j). 
ij 

Portanto grad f (Œ) = I. Seja U C R” o conjunto aberto formado pelas matrizes 
(invertíveis) x tais que det x Æ 0. Para toda x € U, o desenvolvimento de Laplace 
nos mostra que algum menor X;; é £ 0, logo grad f(x) # O. Portanto a função 
f: U —> R não possui pontos críticos: todo número real c é um valor regular 
de f. Logo M = f”!(1) = conjunto das matrizes reais n x n com determinante 
1 é uma hiperfície CS. M é um grupo em relação à multiplicação de matrizes, 
conhecido como o grupo unimodular. O espaço vetorial Ti(M), tangente a M 
na matriz identidade I, é formado pelas matrizes x que são perpendiculares (em 
termos do produto interno de R”’) ao gradiente grad f (I) = I. Ora, 


(x, I) = 2 Xijôij = 3 Xi; = traço de x. 


ij=1 i=l 


Assim, o espaço vetorial tangente a M no ponto I é o conjunto das matrizes de 
traço nulo. < 


Observação. O Teorema 3 é uma boa fonte de exemplos de hiperfícies. Mas nem 
toda hiperfície M C R"*! pode ser obtida como imagem inversa M = f!(c) 
do valor regular c de uma função f : U —> R. Com efeito, as hiperfícies desse 
tipo admitem um campo contínuo de vetores não-nulos v = grad f : M > R"+!, 
tais que, para todo x € M, (v(x), w } = O qualquer que seja w € TyM. (Diz-se 
então que v = grad f é um campo de vetores normais a M.) Tais hiperfícies são 
chamadas de orientáveis. Um exemplo bem conhecido de superfície não-orientável 
é a faixa de Moebius. Logo, a faixa de Moebius não é imagem inversa de um valor 
regular de uma função de classe C! definida num aberto de Rº. 
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3 Multiplicador de Lagrange 


O método do multiplicador de Lagrange se aplica na seguinte situação: tem-se 
uma função f : U —> R, de classe C! no aberto U C R”+! (função-objetivo), uma 
hiperfície M = 7! (c), imagem inversa do valor regular c da função ọ : U > R, 
de classe C!, e procura-se determinar quais são os pontos críticos da restrição 
fIM, ou seja, os pontos críticos x de f sujeitos à condição g(x) = c. 

Não se trata de determinar os pontos críticos de f : U —> R que estão locali- 
zados sobre a hiperfície M mas sim os pontos críticos da função fIM:M > R. 
É preciso definir o que se entende por isto. 

Um ponto x e M chama-se um ponto crítico da restrição fIM quando, para 
todo caminho diferenciável À : (—8, 8) > M com À(0) = x tem-se (f o ày (0) = 
0. Pondo v = A'(0), esta condição significa (grad f(x), v) = 0. Como v é um 
vetor arbitrário pertencente ao espaço vetorial tangente T, M, vemos que x e M é 
um ponto crítico de f|M se, e somente se, grad f(x) é ortogonal ao espaço vetorial 
tangente TM. 

Ora, grad y(x) é um vetor (não-nulo) ortogonal a T, M. Como o complemento 
ortogonal de T, M em R”*! tem dimensão 1, segue-se que grad f(x) L TyM se, e 
somente se, grad f(x) é um múltiplo de grad (x). Portanto, podemos enunciar: 

O ponto x e U é um ponto crítico da restrição fIM de f à hiperfície M = 
q” !(c) se, e somente se: 


D q) =c; 
2) grad f(x) = À - grad y(x) para algum À € R. 


As condições acima representam um sistema de n + 2 equações (pois a igual- 
dade vetorial 2) acima significa n + 1 igualdades numéricas) nas n + 2 incógnitas 
x1,..., Xn+1 (coordenadas de x) e À. O fator À é chamado o multiplicador de La- 
grange. Sua presença torna o número de incógnitas igual ao número de equações, 
o que viabiliza a solução na prática. 

Deve-se notar que se x e M é um ponto de mínimo ou de máximo local de f |M 
então, para todo caminho diferenciável À : (—ô, ô) — M com À(0) = x, a função 
f oà: (—ô,8) — R tem um mínimo ou um máximo local no ponto 0, logo 
(f o A) (0) = 0. Portanto os mínimos e máximos locais de fIM estão incluídos 
na definição de ponto crítico dada acima. 

É também evidente que todo ponto crítico x da função f : U —> Ré, com 
maior razão, ponto crítico da restrição fIM pois, sendo grad f(x) = 0, tem-se 
(grad f(x), v) = O para todo v € R'*1. 

Muitas vezes, a condição adicional p(x) = c é posta sob a forma q(x) = 0. 
Isto não representa perda de generalidade. Basta usar, em vez de y, a função 
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y(x) = p(x) — c. Então Y (x) = 0 & g(x) = c e c é valor regular de q se, e 
somente se, O é valor regular de y. 


Exemplo 7. Seja f : R? — R definida por f(x,y) = ax + by, coma? + b? £ 0. 
O gradiente de f é, em todo ponto (x, y), o vetor constante não-nulo v = (a, b), 
ortogonal às linhas de nível ax + by = c, que são retas, duas a duas paralelas. A 
função f não tem pontos críticos. Mas 


| 
Rs | 


E 


Figura 3. 


sey: R? —> R for dada por (x, y) = x? + y? então grad (x, y) = (2x, 2y), 1 
é valor regular dep e M = g7! (1) é a circunferência unitária x? + y? = 1. Como 
M é compacta, a restrição f |M possui pelo menos dois pontos críticos, nos quais 
assume seus valores mínimo e máximo. Os pontos críticos de f |M são as soluções 
(x, y) do sistema 


grad f(x,y) = à : grad o(x, y), gx, 7) =1, 
ou seja: 
2x =a, 2hy=b, x+y =l. 


Portanto (x, y) é um ponto crítico de f|M se, e somente se, o vetor unitário 
z = (x, y) é um múltiplo do vetor v = (a, b). Isto nos dá 


(x =( a b ) ou (x =( ads e ) 
id Va? + b2 Væ +b Rd Va +b Vas) 


Estes são os pontos nos quais f(x, y) assume seus valores máximo e mínimo 
em M = S!. < 
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Exemplo 8. Seja f : R” —> R uma forma quadrática. Paratodox = (x1, ..., Xn), 


n 
tem-se f(x) = 5) ajx;x;, onde a = [a;;] é uma matriz simétrica n x n. 
ij=1 
Alternativamente, tem-se f(x) = ( Ax, x),onde A : R” —> R” é o operador linear 
auto-adjunto cuja matriz na base canônica de R” é a. Quais são os pontos críticos 
da restrição f|S"-!, onde S"! é a esfera unitária de R”? Temos S”! = g7! (1), 
onde q : R” — R é definida por (x) = (x, x ) e, como grad q(x) = 2x, 1 é valor 


o n 
regular de q. Por sua vez, Fo =2.5 a;x;, portanto grad f(x) = 2A - x. 
Xi j=1 “o 


Portanto os pontos críticos da restrição f |S”! são as soluções x do sistema Ax = 
2Ax, (x,x) = 1, isto é, são os autovetores do operador A que têm comprimento 
1. Como S””! é compacta, f admite pelo menos 2 pontos críticos em S”™!, a 
saber, os pontos em que assume seus valores mínimo e máximo. Isto fornece uma 
prova de que todo operador auto-adjunto em R” possui autovetores, o que é o passo 
fundamental para a demonstração do Teorema Espectral. < 


Exemplo 9. Seja U C R” o conjunto dos pontos cujas coordenadas são positivas. 
Consideremos as funções f, g : U — R definidas, para todo x = (x1, ..., Xn) € 
U, como f(x) = x1: X2...Xn € Q(x) = xı + x2 +--+ Xn. Fixando s > 0, 
procuremos os pontos críticos de fIM onde M = qy”!(s). Observemos que 
grad p(x) = (1,1,...,1) para qualquer x e U, de modo que M é uma hiperfície. 
Por sua vez, temos grad f(x) = (w1,...,0n) coma; = [| x;. Assim, x e M 
dr 
é ponto crítico de f|M se, e somente se, para algum À, donde lx; = A(i = 
l 

1,..., n). Dividindo a i-ésima dessas equações pela k-ésima, sinos xk/x; = 1. 
Assim, o único ponto crítico de f|M é aquele que tem suas coordenadas iguais, ou 
seja, é p = (s/n,s/n,...,s/n). Afirmamos que f(p) = (s/n)” é o maior valor 
de fIM. Com efeito, a fórmula de f define uma função contínua no compacto 
M, onde possui um ponto de máximo, o qual não pode estar em M — M pois 
X1 X2...Xn =0sex € M-—M. Logo esse máximo está em M, portanto é 
um ponto crítico, mas p é o único ponto crítico de f|M. Conclusão: quando n 
números positivos têm soma constante s, seu produto é máximo, igual a (s/n)” 
quando eles são iguais. Ou ainda, se x1, .. . , Xn São positivos então 


n 


= 
X1: X2...Xn < : 


A desigualdade acima, posta sob a forma 


E: Xy Hx ++ 
X1ºX2...Xn < P 3 
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diz que a média geométrica de números positivos é menor do que ou igual à média 
aritmética. Além disso, elas coincidem somente quando os números dados são 
iguais. < 


Exemplo 10. Dadas a função f : U —> R, de classe C*no aberto U C R”+! ea 
hiperfície M C U, os pontos críticos da restrição f|M são os pontos x e M para 
os quais grad f(x) é ortogonal ao espaço vetorial tangente T, M, mesmo quando 
M não é obtida como imagem inversa q”! (c) de um valor regular de uma função 
p:U — R de classe C*. Isto ficou claro na discussão feita no início desta seção. 
Como exemplo, consideremos uma hiperfície M C R"*!, um ponto a e R"*! não 
pertencente a M e indaguemos quais são os pontos p e M situados à distância 
mínima de a. Trata-se de obter os pontos que tornam mínima a restrição fIM, 
onde 


a 
ag E a 
/ \ 
rd p N 
mis N 
N N 
N N 
Mer e par 
Figura 4. 


f: U > R, dada por f(x) = |x — a|, tem U = R"*! — {a} por domínio, por isso 
é de classe C. Temos f(x) = y >: (x; — a;)2, logo 3f /3x; = (x; — a;)/|x — a| 
e daí grad f(x) = x — a/|x — a|. Assim, os pontos críticos de f, entre os quais 
estão os pontos de M situados à distância mínima de a, são os pontos x € M tais 
que x — a é um vetor normal a M no ponto x, isto é, (x — a,v) = O para todo 
v € T,M. Em particular, se M = S”, x —a L TS" significa x — a = a -x isto 
é, x = a/(1 — q). Portanto, neste caso, os únicos pontos críticos de f |S” são os 
pontos x € S” pertencentes à reta 0a, os quais são + a/|a|. Um deles minimiza 
|x — a| e o outro maximiza f. < 


Observação. Os pontos críticos da restrição f|M da função f : U > R à hi- 
perfície 710), onde o : U —> R tem O como valor regular, são, como vimos, 
as soluções x do sistema de equações grad f(x) = À - grad ø (x), p(x) = O. Se 
considerarmos a função L : U x R > R, definida por L(x, à) = f(x) — àg (x), 
vemos que as equações acima são satisfeitas se, e somente se, grad L(x, à) = 0, 
ou seja, os pontos críticos de f sujeitos ao vínculo (x) = O são precisamente os 
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pontos críticos (livres) da função L, chamada a Lagrangiana do problema. 


Capítulo 5 


Aplicações Diferenciáveis 


1 A derivada como transformação linear 


Uma aplicação f : U — R”, definida no aberto U C R”, diz-se diferenciável no 


ponto a € U quando cada uma das suas funções-coordenada fi, ..., fa : U —> R 
é diferenciável nesse ponto. 
Se este é o caso então, para todo v = (&1, ..., œm) tal que a + v € U e para 
cada i = 1,...,m, tem-se 
z f] i . rAvV 
fila+v)— fila) = so fi (a) -a;+ri(v) com lim rito) = 
ja 9X; v>O lv] 
afi 


A matriz Jf (a) = | | e M(n x m) chama-se a matriz jacobiana 


0X; 
de f no ponto a. 
A transformação linear f'(a): R” —> R”, cuja matriz em relação às bases 
canônicas de R” e R” é Jf(a), chama-se a derivada da aplicação f no ponto a. 
De acordo com a definição de matriz de uma transformação linear, para todo 
v=(01,...,4m) E R” temos 


; — afi ofi 
( ) y = ( | Pa n) d i = ( ) Ê j = —( ) hd 
f (a)-v B1 B, onde $£ 3 dx; a) a; Ju a 


Assim, se definirmos, como é natural, a derivada direcional da aplicação f, no 
ponto a, na direção do vetor v, como 


OP o mc ted tu) = fla) 
— (a) = lim ; 
dv 1>0 t 
teremos imediatamente 
of = fi ð fn — fl E 
ae (5 (a),..., 3v (o) = f (a) v. 
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Resulta da Regra da Cadeia para funções (Teorema 2 do Capítulo 3), em confor- 
midade com a observação feita logo após sua demonstração, que embora a definição 


o o 
de La) tenha sido dada acima como ag = (f o ày (0), onde À (t) = a + tv, 
v v 
vale, mais geralmente, a igualdade — (a) = (f o ày (0) para qualquer caminho 
v 
diferenciável à : (—ô, ô) > U, com à (0) = a e à’ (0) = v. 


As n igualdades numéricas que exprimem a diferenciabilidade das funções- 
coordenada f; se resumem na igualdade abaixo, entre vetores de R”: 


f(a+v)-— f(a) = f'(a)-v+r(v), com lim 7 =0. 
Algumas vezes, é mais conveniente escrever esta condição sob a forma 
Hat v)— fla) = fa) -v + o(v)- lol com lim o(v) =0. 


Aqui, p(v) = r(v)/|v| para todo v Æ 0 tal quea +v € U. 

A relação acima caracteriza univocamente a diferenciabilidade da aplicação f 
no sentido seguinte: se uma transformação linear T : R” —> R” é tal que, para 
a,a + v € U tem-se 


f(ía+v)— f(a) =T.v+r(v), com lim =0, 
v—> v 
então T = f'(a). 
Com efeito, daí resulta, tomando tv em vez de v, que: 
tv) — t 
fla+tv) — f(a) PEEN r(tv) ol, 
t tv] 
logo 
tv) — f) 
up ia DOS E SM Ea 
t>0 t ðv 


Quando f : U — R” é diferenciável em todos os pontos de U, dizemos que f é 
diferenciávelem U. Neste caso, fica definida uma aplicação f’ : U > £L(R”; R”) 
que faz corresponder a cada x € U a transformação linear f'(x): R” > R”. 
Quando for conveniente, identificaremos o conjunto £(R”; R”) das transforma- 
ções lineares de R” em R” com o conjunto M (n x m) das matrizes n x m ou com 
o espaço R””. 

Dizer que a aplicação derivada f’: U > £L(R”; R”), (ou seja f’: U > R”) 
é contínua equivale a afirmar a continuidade de cada uma de suas nm funções- 
coordenada df;/0x;: U —> R, isto é, a dizer que f é uma aplicação de classe 
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C! conforme a definição dada no Capítulo 3. Como foi demonstrado no Teorema 
1 daquele capítulo, a continuidade das derivadas parciais 3f;/ðƏx; : U > R 
implica a diferenciabilidade de f. 

Como no caso de funções, aplicações f : U —> R” de classe C* são definidas 
por indução: diz-se que f € C* quando f é diferenciável e sua derivada f’: U —> 
R”” é de classe C%!. Se f e C* para todo k E N diz-se que f é de classe 
CO: f e C”. Então f'e C” também. 


Observação. Na maioria das vezes, a maneira mais simples de verificar que uma 
aplicação f é diferenciável consiste em calcular diretamente as derivadas parciais 


ofi ; 
g O» mostrar que elas dependem continuamente de x e usar o Teorema 1 do 
Xj 


Capítulo 3, segundo o qual toda função de classe C! é diferenciável. Praticamente 
todas as aplicações diferenciáveis são de classe C!. Ocorre, entretanto, que as 
propriedades mais relevantes das aplicações C! resultam da relação que caracteriza 
sua diferenciabilidade. Daí a importância deste conceito. 


2 Exemplos de derivadas 


Exemplo 1. Sejam 7 C R um intervalo aberto e f : I —> R” um caminho dife- 
renciável no ponto a € I. Considerando f como uma aplicação, sua derivada no 
ponto a é a transformação linear f'(a): R —> R” cuja matriz jacobiana tem por 


única coluna o vetor 
v= (Zo... di ©); 


o qual vem a ser o vetor-velocidade do caminho f no ponto a, já indicado com a 
mesma notação f'(a) no Capítulo 2. Como transformação linear, f'(a) : R > R” 
faz corresponder a cada “vetor” t e R o vetor t.v e R”. Noutros termos: 


fa) -t =t. f'(a). < 


Exemplo 2. Seja f : U —> R uma função definida no aberto U C R”, diferenciá- 
vel no ponto a € U. Sua derivada é uma transformação linear f'(a): R” > R, 


portanto um funcional linear, que associa a cada vetor v = (@1,..., œn) ER” O 
número 
j f) f) f) 
f(a): v= E EEEL F = TE (grad f(a), v). 
əx Xm dv 


Às vezes se escreve df (a) e chama-se a diferencial de f à derivada f'(a). Em 
particular, se usarmos a notação tradicional x; : R” — R para indicar a função 
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que associa a cada ponto x € R” sua i-ésima coordenada x;, a diferencial dx; desta 
função é o funcional linear que faz corresponder a cada vetor v = (w1,..., Œm) 
sua i-ésima coordenada dx; -v = œ; (mesmo porque, sendo linear, a função x; tem 
derivada constante, igual a si própria). Então 


m 


ð "a 
df(a) -v = e (a) a; = = (a) dv. 


i= i= 


Isto atribui um significado à expressão clássica 


< 


Exemplo 3. Se f : U —> R” é constante então f'(x) = O para todo x € U. Reci- 
procamente, se o aberto U CR” é conexo e f: U —> R” possui derivada 
O em todos os pontos x € U então f é constante. (Conforme o Corolário 3 do 
Teorema 2, Capítulo 3.) < 


Exemplo 4. Se T : R” — R” é uma transformação linear então T é diferenciável 
e T'(x) = T para todo x € R”. Noutras palavras, T'(x) -v = T - v quaisquer que 
sejam x, v € R”. Isto resulta imediatamente da igualdade T(x + v)— T -x = 
T -v +r, onde r = 0, ou então do fato óbvio de que a matriz jacobiana de T é 
a própria matriz de T. Um caso muito particular: a soma S : R” x R” > R”, 
S- (x, y) = x + y é linear, logo S'(x, y) - (u, v) = u + v quaisquer que sejam 
x, y, u, v E€ R”. < 


Exemplo 5. Seja B : R” x R” —> R? uma aplicação bilinear, isto é, linear em 
cada uma de suas duas variáveis. Se escrevermos, para cada par de vetores (e;, ej) 
das bases canônicas de R” e R” respectivamente, B(e;,e;) = vij, então, para 
x=(X,,...,Xm)€y = (Visse Yn) teremos 


BOM) =D aI. 


ij 


Isto mostra que B é contínua, logo assume seu valor máximo |B| no compacto 
S™—! x s"-1. Daí resulta que, para quaisquer x € R” e y € R” não-nulos, 
vale |B (x, y)| = BC /|x|, y/lyDl -Ixl- Iyl < IBI |x|- Iy]. Para x = O ou 
y = 0, a desigualdade |B(x, y)| < |B|- |x|- |y| é imediata pois B(0, y) = 
B(x, 0) = O. Mostremos agora que toda aplicação bilinear B é diferenciável, com 
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B'(x, y) - (u, v) = B(u, y) + B(x, v). Com efeito, se x,u € R” e y,v € R”, 
temos pela bilinearidade de B: 


B(x +u, y + v) — B(x, y) = B(u, y) + B(x, v) + B(u, v). 
Observando que | (u, v)| = y jul? + |v|? > |v], temos 


|B(u, v)| |B|- lul- lvl 
Ere S eee] el 
|u, v)| ul” + [v]? 
. Blu, v) i 3 o 
logo lim = 0, comprovando assim a diferenciabilidade de B. < 


uw>0 |(u, v)| 
Nos exemplos 4 e 5 acima (e, obviamente, no Exemplo 3), as aplicações con- 
sideradas são de classe CW. De fato, a derivada T' = T : R” > £L(R”; R”) 
de uma transformação linear T, sendo constante, possui derivada nula e todas 
as derivadas seguintes também serão nulas. Quanto à aplicação bilinear B, sua 
derivada B’ : R” x R” > LR” x R”; RP) é a transformação linear (x, y) => 
B(e, y) + B(x, e), recaindo assim no Exemplo 4. 
Exemplo 6 (Derivada complexa). Uma função de variável complexa f : U —> 
C, definida no aberto U C C, pode ser vista como uma aplicação f : U > R?, 


definida no aberto U C R?. A derivada da função complexa f no ponto z € U é 
o número complexo f'(z), definido como o limite 


Pete 
H 2 
quando tal limite existe. Isto equivale a dizer que 


POS 


f(z + H)-— f(z) = f(z): H +r(H), onde lim =0 


Acima, f'(z) - H é uma multiplicação de números complexos. Portanto, a função 
complexa f : U — C é derivável no ponto z € U se, e somente se, a aplicação 
f:U — R? é diferenciável nesse ponto e, além disso, sua derivada f'(z) : R? —> 
R? é uma transformação linear do plano que consiste em multiplicar por um número 
complexo fixo. Ora, se T : R? > R? é uma tal transformação, da forma T - z = 
(a + bi) - z, sua matriz na base canônica tem as colunas T -1 =a +bieT -i = 


—b + ai, ou seja, sua matriz é do tipo E | . Se, para z = x + yi, f(z) = 
u(x, y) +i- v(x, y), a matriz jacobiana de f é 


ðu ðu 
dx Oy 


dv dv 
Lx a] 
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Segue-se então que a função complexa f é derivável em U se, e somente se, valem 
as relações du/0dx = dv/dy e du/dy = —dv/dx em todo ponto z = x + yi E U. 
Estas igualdades são conhecidas como as equações de Cauchy-Riemann. < 


A derivada de f, considerada como função de uma variável complexa é 


x ðu ðv . 
fo) = TUT 3y ETA 


Exemplo 7. Se fg: U — R” são diferenciáveis no ponto a e€ U C R” então 
a aplicação (f, g): U —> R” x R”, definida por (f, g8)(x) = (f(x), g(x)), é 
diferenciável no ponto a e sua derivada é (f, g) (a) - v = (f'(a) - v, g' (a) - v). Se 
f, g e C* então (f, g) também é de classe C*. < 


3 Cálculo diferencial de aplicações 


Teorema 1 (Regra da Cadeia). Sejam U C R”, V C R” abertose f : U —> R”, 
g: V — R? diferenciáveis nos pontosa € U, b = f(a) € V, com f(U) C V. 
Então g o f : U > R? é diferenciável no ponto a e 


(go fY (a) = g'(b) - f'(a) : R” > R°. 
Resumidamente: a derivada da aplicação composta é a composta das derivadas. 

Demonstração. Podemos escrever 

fla+v) = fa) + fa) v+ pW) lvl, com limp(v)=0 e 

eb+w)=g(b+g(b)-w-+o(w)-|w|, com lim o (w) =0. 
Então 

(go fa +v) = g(f (a) + f'(a): v+ p0): lvl). 

Pondo w = f'(a) -v + p(v)- |v|, obtemos: 


(go f(a +v) = g(b + w) = g(b) + g'(b)- f'(a) -v+ g'(b)- o(v)ul 
+o(w)-|wl = (g o fa) + [g (b) - F'@)] -v +C). lvl, 


onde 


Cw) = g'(b) - pw) +0 (w) - | f'(a): Dl +p). 


Se v —> 0 então w > 0e f'(a). a é limitada. Portanto lim C(v) = 0, provando 
v v> 


o teorema. 
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Coroláriol. Se f : U — R" e g : V —> R? (com U C R” e f(U) C V C R”) 
são de classe C* então g o f : U —> R é de classe C*. 


Com efeito a Regra da Cadeia, aplicada num ponto genérico x € U, lê-se 
(go FY (x) = 2'(f(x)) - f(x). Em termos funcionais, temos 


(go) = (8 o f) f: U > LR"; RP), 


onde o é a composição de aplicações e - é a multiplicação de transformações 
lineares, a qual é bilinear, logo CW. Se f e g são de classe C | esta última 
igualdade mostra que (g o f)’ é contínua, logo g o f € C!. Por indução, supondo 
f eg de classe C*, a mesma igualdade mostra que (go f)! e C11, logo go f € Cr. 


Corolário 2. Nas condições do Teorema 1, a matriz jacobiana de g o f no ponto 
a é o produto da matriz jacobiana de g no ponto f (a) pela matriz jacobiana de f 


no ponto a: J(go fa) = Jg(f(a)) -Jf (a). 


Em termos de derivadas parciais, a igualdade acima lê-se 


dg so 08 dx 
0x ; tzi dyk dx; 


Nesta fórmula, escrita da maneira tradicional, os x; são coordenadas de um ponto 
em U, os yg em V, dgi;/0x; é derivada parcial de g; o f enquanto dg;/dyk é 
derivada de g; e, finalmente, dy;/0x; significa, em nossa notação costumeira, 
9fk/9x;. Com tais entendimentos tácitos, essa fórmula tem sobrevivido e sido útil 
através dos anos. 


Corolário 3 (As regras de derivação). Sejam fg: U > R” diferenciáveis no 
pontoa € U C R”, æ um número reale B : R” x R” > R? bilinear. Então: 


1) f4g: US R” édiferenciávelno pontoa, com(f+g)' (a) = f(a)+g'(a). 
2) œ: f : U —> R” édiferenciável no ponto a, com (af yY (a) = a - f'(a). 


3) BL): U > Rº, definida por B(f, 8)(x) = B(f (x), g(x)), é diferen- 


ciável no ponto a, com 
[B(f, 8) (a) -v = B( f'(a): v, g(a)) + B(f (a), g (a) - v). 


Os itens 1) e 2) podem ser provados diretamente a partir da definição de aplica- 
ção diferenciável ou então considerando as transformações lineares S : R” x R” —> 
R”, œ* : R” —> R”, definidas por S(x, y) = x + y e æ*(x) = a - x. Então é só 
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observar que f +g = So(fig)ea-f=a“o f e usar a Regra da Cadeia, 
lembrando que S = S e (&*) = a*, logo 


(AD =So(f, g= f +g e (af) = @* o fY =a 0 f =a f. 


Quanto ao item 3), basta usar a Regra da Cadeia e os Exemplos 5, 7. Então, como 
B(f,g) = B o (f, g), temos, para cada v € R”: 


[B(f, 8) (a): v = [B 0 (f, Ia) - v = B'(f (a), g(a)) - (f'(a) -v, g'(a) - v) 
= B(f' (a) - v, g(a)) + B(f (a), g'(a) - v) 


Observação. Uma aplicação bilinear B : R” x R” — R? pode (e deve) ser 
considerada como uma forma de multiplicar um elemento de R” por outro de 
R” obtendo um produto em R?. Usando a notação multiplicativa x e y em vez de 
B(x, y), a regra de derivação do item 3) do Corolário 3 lê-se (feg) = f'eg+feg 
isto é, para todo x € U e todo v € R?, (f èe g) (x)- v = (f'(x)- v) e g(x) + 
f(x) e g' (x) - v. (O ponto maior e é o produto que substitui B e o ponto menor - 
é a aplicação de uma transformação linear sobre um vetor.) 


Exemplo 8. Um exemplo fregiiente de aplicação bilinear é o produto interno de 
vetores. Se tivermos (x) = ( f(x), g(x)), com fg: U —> R” diferenciáveis 
em U C R” então, para todo v e R”, vale q'(x)-v = (Ff) -v,g(x)) + 
(FO) g (x) - v). Em particular, se g(x) = ( f(x), fO)) = If GO] então 
Yx) -v = H f(x), f(x) - v). Levando em conta a fórmula (yuy = u'/2u 
para a derivada da raiz quadrada de uma função real positiva u, daí resulta que, 
pondo 


EO) = (SO), fO)) SI, tem-se Ex): v= (FE) v, FO) FO] 


sempre que f(x) Æ 0. < 


Exemplo 9. Outro exemplo comum de aplicação bilinear é a multiplicação de ma- 
trizes (ou de transformações lineares). Vejamos um caso particular desta situação. 
Se A : R” —> R” é um operador auto-adjunto então resulta do exemplo anterior 
que a derivada da forma quadrática p(x) = (Ax,x) atua assim: g'(x): v = 
(Av, x) +( Ax, v) = 2( Ax, v), levando em conta que (Av, x) = ( v, Ax }, pela 
definição de operador auto-adjunto. Algumas pessoas preferem considerar A como 
uma matriz m xm ex E€ R” como uma matriz x do tipo m x 1 (matriz-coluna) cuja 
transposta xT é uma matriz-linha 1 xm. Então a forma quadrática g se escreve como 
(x) = x! Ax. Desta maneira, para cada vetor v € R” (ou seja, para cada matriz v 
do tipo m x 1) tem-se g'(x) -v = vTAx + x! Av = x! Av + x! Av = 2x! Ay, que 
corresponde a 2( Ax, v ) na notação de operadores. < 
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Exemplo 10. Seja U C M(n x n) o conjunto das matrizes invertíveis n x n, isto 
é, das matrizes que têm determinante Æ 0. Como o determinante é uma função 
contínua, U é aberto. Seja f : U —> M(n x n) a aplicação que associa a cada 
x € U sua inversa f(x) = x"!. Afirmamos que f é diferenciável e que, em cada 
ponto x € U, sua derivada f(x): M(nxn) > M(n xn) é a transformação linear 
definida por f'(x)-v = —x!.v-x !,v € M(n xn). Para provar isto, atribuiremos 
a cada matriz x e M(n x n) a norma |x|, igual à norma da transformação linear 
X : R” — R” que tem x como matriz na base canônica. (Veja Exemplo 12, 
Capítulo 1.) Mais explicitamente: |x| = supf|X -ul;u € S”7!}. Como se vê 
facilmente, se x,y e M(n x n) então |x-y| < |x|- |y]. Provemos agora a 
diferenciabilidade de f. Escrevemos 


«+wy — x! = -x !vx l! +r(v) 


e mostramos que lim r(v)/|v| = O. Com este objetivo, multiplicamos ambos os 
v- 


membros da igualdade acima, à direita, por x + v. Após uma simplificação óbvia, 
obtemos 


r= a v aN], 
donde 
P Ir(v)] < px! 


2 = 
Fla + |v] 
|v] 


rI E ven], 


e daí lim r(v)/lv| = 0. (O uso de (x + v)™! se justifica pelo fato de que, sendo U 


aberto, x € U = x + v € U para toda v suficientemente pequena.) < 


Observação. Na verdade a inversão de matrizes f : U —> U, considerada no 
Exemplo 10, é uma aplicação C”. Isto pode ser verificado diretamente, a partir da 
fórmula que exprime x”! em função de x, utilizando a chamada “adjunta clássica” 
de uma matriz. (Ver também “Análise no Espaço R””, página 26.) 


Lembremos que a norma de uma transformação linear T : R” > R” éo 
número |T| = sup {|T -ul;u € S”"-!]. Desta definição resulta que, para todo 
v € R”, tem-se |T -v| < |T|- |v] e que, se S : R” —> R? é outra transformação 
linear então |S - T| < |S| - IT|. 


Teorema 2 (Desigualdade do Valor Médio). Seja f : U —> R” diferenciável em 
todos os pontos do segmento de reta [a,a + v] C U. Se, para todo t € [0,1], 
tem-se | f'(a + tv)| < M então | f(a + v) — f(@| <M lvl. 
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Demonstração. O caminho À : [0,1] — R”, definido por A(t) = f(a + tv), é 
diferenciável, com À(t) = f(a+tv)-v, portanto [A (D| < |f (a + tv)| - |v] < 
M - |v] para todo t € [0, 1]. Segue-se então da Desigualdade do Valor Médio para 
caminhos (Teorema 1 do Capítulo 2) que |A(1) — A(O) < M - |v|- (1 — 0), isto é, 
fla +v)— Fa)l<M. ol. 


Corolário 4. Seo aberto U C R” é conexoe M > Q é tal que a aplicação 
diferenciável f : U > R” cumpre |f'(x)| < M para todo x E U então f satisfaz 
a condição de Lipschitz | f (x) — f @)| < M|x — y| para quaisquer x, y € U. 


Teorema 3 (Diferenciabilidade Uniforme). Seja f : U —> R” de classe C! no 
aberto U C R”. Se K C U é compacto então f é uniformemente diferenciável 
em K. 


Demonstração. Isto significa que, para todo € > O dado, pode-se obter ô > O tal 
que |v| < ô implica 


fa +v) -= fœ) - FO) -vl < e- lol 


qualquer que seja x € K. Para estabelecer este resultado, uma vez dado s > 0, 
devemos inicialmente encontrar ô > 0 com a seguinte propriedade: para todo 
x € K e todo v € R” com |v| < ô tem-se x +v € U e |f x +v) -— F O|< €. 
Ora, pelo Corolário 2 do Teorema 11, Capítulo 1, existe ô > 0 tal que toda bola de 
centro num ponto x € K e raio 2ô está contida em U. Seja 


L = |] Bix; ôl = {y € R"; dO, K) < ô). 
xeK 

Então L é um compacto, com K C L C U. Sex e Keļv| < ôentãox+v e L.A 
aplicação f’: L > £(R”, R”) é uniformemente contínua. Logo, diminuindo ô se 
necessário, podemos admitir que |f'(x + v) — f'(x)| < e para todo x € K e todo 
v € R” com |v| < 8. Evidentemente, isto acarreta que | f'(x + tv) — f'(x)| < € 
para todo t € [0,1], pois |tv| < |v| quando O < + < 1. Cumprida esta etapa, 
consideremos o caminho À : [0,1] — R”, definido por A(t) = f(x + tv), com 
x € Kelv| < ô. Então A'(t) = f(x + tv)» v. Pelo Teorema Fundamental do 
Cálculo para caminhos, 


1 1 
fato- f =a -40)= f xodr= | fl+tv-v-dt. 
0 0 


Logo 


1 
ao) = fo = Gal E f Fermar oa 


< IF +t) -FOl ul <e-lo. 
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provando assim que f é uniformemente diferenciável em K. 
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Capítulo 6 


Aplicações Inversas e Implícitas 


1 OTeorema da Aplicação Inversa 


Na página 97 do Volume 1 foi estabelecido que se f: Z —> R é derivável no 
intervalo Z C R, com f'(x) > 0 para todo x € I, então f é uma bijeção crescente 
sobre o intervalo J = f(I) e a função inversa g = fl:J- I também é 
derivável, com g'(f(x)) = 1/f' (x). Evidentemente, resultado análogo vale com 
f'(x) < 0, só que agora f é decrescente. Na verdade, pelo Teorema de Darboux 
(pág. 95 do Volume 1), bastaria supor f'(x) * O para todo x € I para garantir 
que f é uma bijeção monótona (crescente ou decrescente) de 1 sobre J = f(D), 
com f!:J-— I derivável. Nos termos da definição que será dada a seguir, 
isto significa que a função diferenciável sobrejetiva f : I —> J, entre intervalos 
I, J C R, é um difeomorfismo se, e somente se, f(x) Æ O para todo x € I. Em 
dimensões superiores esta condição significaria que f'(x) é um isomorfismo, mas 
seria apenas necessária para que f possuísse uma inversa diferenciável. 

Sejam U C R”, V c R” abertos. Uma aplicação f: U —> V chama-se 
um difeomorfismo entre U e V quando é uma bijeção diferenciável, cuja inversa 
g = f7! : V — U também é diferenciável. 

Se f : U —> V éum difeomorfismo, com g = f~! : V —> U, então de go f = 
idy e fog = idy resulta, pela Regra da Cadeia, que g'(f(x)) - f'(x) = idgm 
e f(x) - g(f(x)) = ide» para todo x € U, portanto f'(x): R” —> R” é um 
isomorfismo cujo inverso é g (f(x): R” — R”. Em particular, m = n, ou 
seja, dois abertos em espaços euclidianos de dimensões diferentes não podem ser 
difeomorfos. 


Exemplo 1. No Capítulo 1 (Exemplo 15), vimos que a aplicação f : R” > B, 
definida por f(x) = x/(1 + |x|), é um homeomorfismo de R” sobre a bola 
aberta B C R”, de centro O e raio 1, sendo g : B > R”, g(y) = y/(1— |y]) 
o homeomorfismo inverso de f. Na verdade, como f e g são ambas aplicações 
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diferenciáveis, as duas são difeomorfismos, um inverso do outro. Deve-se observar, 
entretanto, que nem todo homeomorfismo diferenciável é um difeomorfismo, isto 
é, tem inverso diferenciável. O exemplo mais simples disto é f : R —> R, com 
f(x) = x’. Como f'(0) = 0, a função inversa de f (que é g(x) = “/x) não é 
diferenciável no ponto 0 = f(0). 

Uma aplicação diferenciável f : U — R”, definida no aberto U C R”, chama- 
se um difeomorfismo local quando, para cada x € U existe uma bola aberta 
B = B(x;ô) C U tal que f aplica B difeomorficamente sobre um aberto V 


P4 


contendo f(x). Segue-se daí que se f : U — R” é um difeomorfismo local então 
f'(x) : R” —> R” é um isomorfismo, para todo x € U. O Teorema da Aplicação 
Inversa, que provaremos a seguir, diz que quando f e C! vale a recíproca: se 
f'(x) é um isomorfismo para todo x € U então f é um difeomorfismo local. 
Decorre da definição acima que um difeomorfismo local f : U —> R” é uma 
aplicação aberta, isto é, a imagem f(A) de qualquer aberto A C U é um subcon- 
junto aberto de R”. Com efeito, se tomarmos para cada x € A uma bola aberta 
B, C A, com centro x, tal que f seja um difeomorfismo de B, sobre um aberto 


V, C R”, então A = UU B, e f(A) = f (UB) = U f (B) = UV, é uma reunião 
xEA 
de abertos, logo é um aberto. 


Observemos ainda que o difeomorfismo local f : U —> R” é um difeomorfismo 
(global) de U sobre o aberto V = f(U) C R” se, e somente se, é uma 
aplicação injetiva. < 


Exemplo 2. Seja f : R? —> R? definida por f(x, y) = (e* cos y, e” sen y). Evi- 
dentemente, f e CW. Cada reta vertical x = a é transformada por f, com 
período 27 (isto é, f(a, y) = f(a, y) & y' — y = 2kmr,k € Z), sobre a cir- 
cunferência de centro O e raio e°. Cada reta horizontal y = b é levada por f, 
bijetivamente, sobre a semi-reta aberta que parte da origem e passa pelo ponto 
(cos b, sen b) € S!. A imagem de f é R? — {0}. Em termos da variável complexa 
z = x + iy, tem-se f(z) = e. A aplicação f é um difeomorfismo local (mas 
não global pois f(x,y +27) = f(x, y)). Isto decorre do Teorema da Aplicação 
Inversa (Teorema 4, a seguir), pois a matriz jacobiana 


1100.) =| 


e“cosy —e! sen y 
e* seny etcosy 


tem determinante e*, portanto Æ 0, logo f'(x, y): R? —> R? é um isomorfismo, 
para todo (x, y) € R?. Podemos também chegar à mesma conclusão observando 
que se wo = f (zo) então o ramo da função complexa log w tal que log wo = Zo é 
uma aplicação inversa local de f no ponto wọ = f (zo). 

Se Z C R é um intervalo aberto então todo difeomorfismo local f : I > R é 
um difeomorfismo (global) de 1 sobre J = f (I). < 
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Teorema 1. Se o difeomorfismo f : U —> V é de classe C*(k > 1) então seu 
inversog=f":V —> U também é de classe C4. 


Demonstração. (Indução em k). Para todo y = f(x) € V, temos g'(y) = 
LEGO! = [f(f (TI, portanto a aplicação g': V > LR”) = R” se 
exprime como a composta 


g = (Ino fo f! 


onde Inv leva todo operador invertível X : R” —> R” noseuinversoX!, f’: U —> 
£L(R”), f’ leva todo ponto x € U na derivada (invertível) f'(x): R” > R” e 
f=! : V — U é aplicação inversa de f. Sabemos que Inv € C%. Portanto, se 
f € C% então f’ e C1! e, pela hipótese de indução, f7! e Ch! logo g' e CHI, 
como composta de três aplicações de classe C*7!. Por definição, isto significa que 
gec. 


Teorema 2. Seja f : U —> R” de classe C! no aberto U C R". Se, para algum 
a € U, aderivada f'(a) : R” —> R” éinjetiva então existem ô > Oec > 0 tais que 
B = B(a; 8) C U e, para quaisquer x, y € B tem-se |f (x) — fŒ) > clx — yl. 
Em particular, a restrição f |B é injetiva. 


Demonstração. A função u > |f'(a) - u| é positiva em todos os pontos u da 
esfera unitária S”-!, a qual é compacta. Pelo Teorema de Weierstrass, existe 
c > 0 tal que | f'(a) - u| > 2c para todo u € S”-!. Por linearidade, segue-se que 
|f (a) - v| > 2c- |v| para todo v € R”. Para todo x € U, escrevamos 


rŒ) = fœ) — fa) — faa- a). 


Então, para x, y E U quaisquer, temos 


fe) = fo = fa) ayra) -ro). 


Levando em conta que |u + v| > |u| — |v], segue-se que 


IF@- FOL = If E-l- lre- ro) 
> 2e-jx-= yl = lir&)-=ro)l. 


Observemos que a aplicação r, acima definida, é de classe C!, com r (a) = 0. Pela 
continuidade de r’, existe ô > O tal que |x — a| < ô > xe UVelr()|<c. A 
Desigualdade do Valor Médio, aplicada a r no conjunto convexo B = B(x; ô) nos 
assegura que se x,y e B então |r(x) — r(y)| < clx — y|. Consegiientemente, 
x,y E€ B => |f@œ)-— fO) > 2Zclx-—y| — clx — yl, ou seja, | f(x) — fO) > 
clx — y|, como queríamos demonstrar. 
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Teorema 3 (Diferenciabilidade do Homeomorfismo Inverso). Seja f: U > 
V um homeomorfismo diferenciável entre os abertos U, V C R”. Se, para al- 
gum x e U, a derivada f'(x): R” —> R” é um operador invertível então o 
homeomorfismo inverso g = f!:V-> U é diferenciável no ponto f(x), com 


LE = [If GOT. 


Demonstração. Sex,x + v € U, escrevamos f(x) = ye f(x+tv)=y+u. 
Então 


fœ +v) -— fx) = f(x)-v+r(v) onde tim O =0 e 


o |v] 
sf ++) -ef a) =g0-+uw)-— 80). 


w 


v 
Para provar que f'(x)! é a derivada de g no ponto y, escrevamos 


go +) goy) = Ff)! w+ sw) (x) 


.  s(w) l a 

e mostremos que lim TT = 0. Entrando na igualdade (x) com as expressões de 
w>0 |w 

v e w acima obtidas, vem: 


v= FOSE) -v row) + sw), 


ou seja: 
v = v + f'(x)! -r(v)+s(w), 
donde 
sn a 
|w] lv] Jul 
isto é: 
TOPAO N 
a E E 
r(v) 


Quando w — 0, tem-se v — O pela continuidade de g, logo —— — 0. Além 
v 
disso, pelo Teorema 2, existem ô > 0 e c > 0 tais que |v| < ô implica 


jul 


ris O) Seb POA E O) E 


s(w) 


Assim, lim — =0. 
o |w] 
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Corolário 1. Se f:U >» V é um homeomorfismo de classe C* cuja 
derivada f(x): R” > R” é invertível para todo x € U então seu inverso 
g = fT! : V —> U é de classe C*. 


Com efeito, a derivada g': V > £L(R”), dada por g'(y) = f'(g(y))! para 
cada y € V, pode ser escrita como g' = f'o Inv og, onde a aplicação Inv, de classe 
Cº, é a inversão de transformações lineares bijetivas e f’ e C*!. Admitindo, 
por indução, que g e C*-1, resulta que g' € C% !, logo g e CH. 


Teorema 4 (Teorema da Aplicação Inversa). Seja f: U > R” de classe 
C*(k > 1) no aberto U CR”. Sea € U é tal que f'(a): R” —> R" é invertível 
então existe uma bola aberta B = B(a;ô) C U tal que a restrição f|B é um 
difeomorfismo sobre um aberto V > f (a). 


Demonstração. Diminuindo ô, se necessário, no Teorema 2 podemos admitir que 
B = B[a;ô] C U e que f é injetiva no conjunto compacto B, logo é um ho- 
meomorfismo de B sobre V = f (B). Pelo Teorema 3, basta então mostrar que 
V c R” é aberto. Seja então q = f (p), p € B. Chamando de S = S[a, ô] a 
esfera que é a fronteira de B, a injetividade de f|B assegura que q é f (S), logo 
existe £ > O tal que |f(x) — q| > 2e para todo x € S, pois f(S) é compacto. 
Afirmamos que B(g; £) C f(B). Com efeito, se y e B(g; £), então o mínimo 
de g(x) = | f(x) — y|, quando x varia no compacto B, não é atingido num ponto 
x € S pois x € S > |f(x)-—»| > £ enquanto |f(p)— y| = Ig — y| < £, com 
p € B. Assim, o mínimo de | f (x) — y|, x € Bé atingido num ponto xy € B. Pelo 
lema a seguir, isto implica que esse mínimo é zero, portanto y = f (xo), donde 


y € f(B),ouseja, B(q; £) C f(B). 


Lema 1. Sejam U C R” abertoe g : U > R” diferenciável no pontoa € U, com 
g (a): R” — R” sobrejetiva. Se a é um ponto de mínimo local de |g (x)|, x € U, 
então g(a) = 0. 


Demonstração. Se a é um ponto de mínimo local para |g(x)|, será também um 
ponto de mínimo local para a função q : U —> R, definida por q (x) = |g (x)|? = 
(g(x), g(x)), logo q'(a) = 0. Mas, como q'(a) - v = Ug'(a) - v, g(a)), isto 
significa que g (a) é ortogonal à imagem de g'(a), a qual é R”. Logo g(a) = 0. 


Exemplo 3. Dadas as matrizesx,m e M (n xn), diz-se que x é uma raiz quadrada 
de m quando x? = m. Nem toda matriz m possui raiz quadrada: como det(x?) = 
(det x)?, uma condição necessária é que detm > 0. Mas esta condição não é 
-1 0 

1 — 
positivo, não existe x € M (2 x 2) tal que x? = m. O Teorema 4 pode ser usado 


suficiente pois é fácil ver que, embora a matriz m = | | tenha determinante 
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para mostrar que toda matriz próxima da identidade In tem raiz quadrada. Com 
efeito, consideremos a aplicação f : M(n x n) > M(n x n), f(x) = x, de 
classe C%. Sua derivada num ponto x e M(n x n) é a transformação linear 
f'a): R? —> R”, dada por f(x) -m=x:-mm-x. Em particular, para 
x = l, tem-se f'(a): m = 2m, logo f(Ij): R? — R° é um isomorfismo. 
Segue-se do Teorema 4 que existe um aberto U em M(n x n), contendo a matriz 
identidade, restrita ao qual f é um difeomorfismo sobre o aberto V = f(U). 
Assim, para toda matriz y € V, existe uma única matriz x = /y € U tal que 
x? = y. Além disso, a aplicação f!:V > U, y > ~y, é de classe C%. < 


Corolário 2 (do Teorema 4). Sejaa € U um ponto crítico da função f : U > R, 
de classe C? no aberto U C R”. Se a matriz hessiana 


92 
Hf(a) =| i o| 


Əxiðxj 


é invertível então existe um aberto V, coma € V C U, no qual não há outros 
pontos críticos de f. 


Com efeito, a matriz hessiana Hf (x) é, para todo x € U, a matriz jacobiana 
da aplicação 


po) po) 
F:USR",F(x) = grad f(x) = (Zo, E Lw) . 


Como Hf (a) éinvertível, F é injetiva numa vizinhança V > a, logo F(x) £ F(a), 
isto é, grad f(x) O para todo x € V. 

Quando grad f(a) = 0 e Hf (a) é invertível, a chama-se um ponto crítico 
não-degenerado da função f. O corolário acima diz que os pontos críticos não- 
degenerados são pontos críticos isolados. 


2 Várias Funções Implícitas 


Os pontos do espaço R”+” serão representados sob a forma z = (x, y), onde 
x = (X1, ..., Xm) E€ R” e y =01,...,Y%h) € R”. Um difeomorfismo h : U — 
V, entre abertos U, V C R”*, será chamado de vertical quando for do tipo 
h(x, y) = (x, ha(x, y)), ou seja, quando deixar invariante a coordenada x. O 
inverso de um difeomorfismo vertical é ainda vertical. 

Um difeomorfismo q: U —> V é usualmente interpretado como uma trans- 
formação geométrica que aplica diferencialmente o conjunto U sobre o conjunto 
V, de forma invertível. Às vezes, porém, é conveniente olhar para y como uma 
mudança de coordenadas, em que as coordenadas do ponto x € U passam a ser 
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aquelas da sua imagem y = (x) € V. Sob este ponto de vista, o teorema a seguir 
diz que se a derivada de uma aplicação f, de classe C*, é sobrejetiva num ponto p 
então é possível obter (de modo bastante simples) um sistema de coordenadas, vá- 
lido numa vizinhança aberta Z de p, tal que, em termos dessas novas coordenadas, 
a aplicação f assume a expressão 


(X1, 0.05 Xm, W1,- -, Wn) > (Wi,..., Wn). 


Teorema 5 (Forma Local das Submersões). Seja f = (f,..., fa) uma apli- 
cação de classe C*(k > 1) de um aberto U C R”™ em R". Se, num ponto 


p = (a,b) € U, a matriz 
dfi EA 
| Fep) (i,j=1,...,n) 
9Yj 


é invertível então existem abertos Z > p em R”™, V > aemR”, Was c=f(p) 
em R” e um difeomorfismo vertical h: V x W > Z, de classe C*, tal que 
f(h(x, w)) = w para todo x € V e todo w € W. 


R^ 
f 
W 
Sh: (za 
Ev: W herr C=4(p) 
— pm 
Figura 1. 


Demonstração. Seja ¢ : U —> R” x R” a aplicação de classe C* definida por 
g(x, y) = (x, f(x, y)). A matriz jacobiana de q tem a forma 


I a 
solo ob 
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onde I é a matriz identidade m x m e a matriz n x n 
dfi 
b = b(z) = žo] 
0); 


é, no ponto p = (a, b), invertível. 

Pelo Teorema da Aplicação Inversa, q é um difeomorfismo de um aberto Z > p 
sobre um aberto de R” x R”, o qual podemos supor da forma V x W, onde 
V c R”eW c R”,coma E V ec = f(a,b)e W. O difeomorfismo inverso 
h: V x W > Z é da forma h(x, w) = (x, h(x, w)). Então, para qualquer 
(x, w) € V x W, tem-se 


(x, w) = ø(h(x,w)) = (x, h(x, w)) 
= (x, f(x, h(x, w)) = (x, f (h(x, w))), 


logo f (h(x, w)) = w para qualquer (x, w) € V x W. 


Dada f : U — R”, de classe C* no aberto U C R”+”, a matriz de sua derivada 
f'(p): R”™ — R” temn linhas e m +n colunas. Ela é a matriz jacobiana J f (p). 
Dizer que a transformação linear f'(p) é sobrejetiva significa afirmar que é possível 
escolher n dessas colunas de modo que a matriz n x n resultante seja invertível. 
No enunciado do teorema acima, as colunas escolhidas são as n últimas porém isto 
nada tem de essencial; trata-se apenas de simplificar a notação. 

Quando a aplicação f : U —> R”, com U C R”*", possui derivada sobrejetiva 
fg): R”+” —> R” em todo ponto z € U, diz-se que f é uma submersão. No 
Teorema 5, a restrição de f ao aberto Z é uma submersão. 

Com esta terminologia, podemos enunciar o 


Corolário 3. Seja f : U — R” uma submersão de classe C*, definida no aberto 
U c R”™, Para cada ponto z € U existem abertos Z C U, contendo z, W CR" 
contendo c = f(z), V C R” eum difeomorfismo h : V x W —> Z de classe C*, 
tais que f (h(x, w)) = w para todo x € V e todo w € W. 


Como f'(z) : R”+™” —> R” é sobrejetiva, n das m + n colunas da matriz jaco- 
biana Jf (e) são linearmente independentes, logo formam uma matriz invertível 
n xn. Se essas forem as últimas colunas, o corolário é meramente o Teorema 5. 
Se não forem, modificamos ligeiramente a demonstração daquele teorema, permu- 
tando inicialmente as coordenadas em R”+” de modo que as n colunas linearmente 
independentes de J f(z) sejam agora as últimas. 


Teorema 6 (Teorema das Funções Implícitas). Seja f = (fi, .-., fa): U > 
R” de classe C* no aberto U c R”™. Suponhamos que, no ponto p = (a, b), 
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com f(p)=c amatriznxn 


dfi ne 
[5 (9) G,j=1,...,n) 
Xj 


seja invertível. Então existem Z C U, aberto contendo p, V C R”, aberto con- 
tendo a, e £ : V > R” de classe C*, com £ (a) = p, coma seguinte propriedade: 


[œ y) E€ Zefa, y) =c] 4 |x e V e y= Ẹ(x)]. 
A equivalência acima significa que fT! (c) N Z éo gráfico de E, isto é, 
FTON Z = (EM); x € V}. 


Demonstração. Sejam Z, V, W e h como no Teorema 5. Definamos é: V > R” 
pondo &(x) = h(x, c), onde h2 : V x W — R” é a segunda coordenada de h, 
ou seja, h(x, w) = (x, ha(x, w)). Assim, (x,y) € Z > x € Ve(x,y) = 
h(x, w),w e W. Se, além disso, tem-se f(x,y) = c então c = f(x,y) = 
f(x, E(x)) e y = E(x). Resumindo: (x,y) € Z e f(x,y) = c implicam x e V 
ey = (x). Reciprocamente, Sex € V e y = E(x) então y = h(x,c) e 


fœ, y) = fœ, hax, c)) = fh, c)) =c. 


O corolário abaixo é uma reformulação mais intrínseca do Teorema 6. 


Corolário 4. Seja f : U — R” de classe C* no aberto U C R”™. Se, no ponto 
p € U, com f (p) = c, a derivada f'(p) : R”™ > R” é sobrejetiva então existe 
um aberto Z C U, com p €E Z, tal que f ()NZéo gráfico de uma aplicação 
E: V > R’, de classe C*num aberto V C R". 


A abordagem clássica do Teorema das Funções Implícitas era a seguinte: “Se 


fi,..., fn são funções reais de m + n variáveis, k vezes continuamente diferen- 
ciáveis, e p = (a1, ..., 4am, b1, ..., bn) é uma solução particular do sistema de 
equações 

fi... , Xm Yis <- 3 Yn) = C1 

fha, reS » Xm, yi, AA 18 Yn) = C2 

fax, s s Xm, yı, a | Yn) = Cn, 


sendo a matriz n x n 


ofi 
[Eo] 
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invertível, então as equações acima definem, de modo único, na vizinhança do 


ponto p em R”*", as variáveis y1, ..., Yn como funções de classe C* das variáveis 
se tus 21 SSI OA eis Ap es CR S us a 

Escrevendo x = (x1,...,Xm) € E(x) = (Ei(x),..., En(x)) tem-se, para cada 
i=1,...,n, com x numa vizinhança de a = (a1,..., Am): 


fi, EO)... En) =c, ou fix, E) = ci. 


Derivando cada uma dessas n identidades em relação a xj, vem: 


n 


Dn 
0X; Ok 0X; 


=0, j=1,..m. 
k=1 


Em termos matriciais, isto significa que 


ou seja: 
d&r A AJ’ pèr 
0x j dy Im dx j 
dEn Ə fn Ofn d fn 
0x j dy IM 0x; 
o 08; E" 
Isto exibe as derivadas parciais a a partir de fi, ..., fn, sem ser necessário 
X . 
conhecer explicitamente as funções & a ieg En: 


Sob o ponto de vista da Álgebra Linear intrínseca, a fim de mostrar como a 
derivada E'(x) : R” —> R” pode ser calculada quando se conhece f mas não É 
explicitamente, é preciso estender o conceito de derivada parcial. 

As transformações lineares 

of of 


=> (z) : R” —> R” e > (z): R” > R”, 
əx dy 
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cujas matrizes nas bases canônicas dos espaços euclidianos em questão são 


E ©] eM(nxm) e E o] eM(nxn) 
0X; 0); 


são chamadas as derivadas parciais de f no ponto z, relativamente à 
decomposição R”+™” = R” GR”, obtida ao se escrever cada z € R”+” sob a forma 
Z = (X1, ---, Xm, Yl; ---, Yn). Assim, Lo é a restrição da transformação linear 
f'(z): R”™ — R” ao subespaço R” c R”*” formado pelos vetores (x, 0) e 
Lo é a restrição de f'(z) ao subespaço R” que consiste nos vetores da forma 


(0, y). Para todo vetor 


ð ə 
w = (u, v) € R”™”, tem-se f'(z)- w = RI e -u + df (o) uv. 
Ox dy 
Usando estas derivadas parciais, a Regra da Cadeia nos permite concluir, a 


partir da identidade f(x, E(x)) = O para todo x € V, que 


0) a 
Lo) + É) FG) =0, com z= E$). 
x dy 
Logo 
EA E 
r@w=-|žo] S 


ainda com z = (x, E(x)). Note que a hipótese do Teorema das Funções Implícitas 

assegura que a transformação linear pO : R” > R” é invertível para todo z na 
y 

vizinhança de p. 

Exemplo 4. Diz-se que o número complexo c é uma raiz simples do polinômio p 

quando se tem p(z) = (z — c)g(z) com q (c) £ O. O Teorema 4 pode ser usado 

para mostrar que as raízes simples de um polinômio dependem diferenciavelmente 


dos coeficientes desse polinômio. A fim de provar isto escrevemos, para cada 
a = (a9, ... , an) E€ C"+! = R”? e cada z € C = R?, 


Pa(z) = p(ao, ... , An, Z) = ao +412 +... + anz”. 
z dp 
Então, de pa(z) = (z — c)g(z) resulta 370 = pi(z) = q(c), logo a matriz 
Z 


7 , ð , 7 ; 
jacobiana (real) 2 x 2, Lo), é invertível, por ser a matriz da transformação 
Z 
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linear de R? que consiste na multiplicação pelo número complexo não-nulo q (c). 
Portanto, em virtude do Teorema 4, existem bolas abertas B = B(a; £) em C"*! 
e B'= B(c;ô) em C tais que, para todo b € B, o polinômio p, possui uma única 
raiz E(b) € B', a qual é simples, e a aplicação é : B —> R?, assim definida, é de 
classe C”. < 


Capítulo 7 


Superfícies Diferenciáveis 


1 Parametrizações 


P4 


Uma imersão do aberto U C R” no espaço R” é uma aplicação diferenciável 
f: U — R” tal que, para todo x € U, a derivada f'(x): R” —> R” é uma 
transformação linear injetiva. Isto, naturalmente, só pode ocorrer quando m < n. 

Quando m = n, toda imersão de U C R” em R” é um difeomorfismo local. 
Em geral, para m < n quaisquer, o Teorema 2 do Capítulo 6 assegura que toda 


imersão é uma aplicação localmente injetiva. 


Exemplo 1. Se Z C R é um intervalo aberto, as imersões f : Z —> R” são o que 
chamamos no Capítulo 2 de caminhos regulares. Assim, por exemplo, f : R — 
R?, definida por f(t) = (t? — t, t?) é uma imersão de R no plano, a qual não é 
injetiva, pois f(—1) = f(1) = (0,1). 


A 


Figura 1. 


Uma parametrização de classe C* e dimensão m de um conjunto V C R” éuma 
imersão q : V —> V de classe C 4 que é, ao mesmo tempo, um homeomorfismo 
do aberto V, C R” sobre V. < 
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Exemplo 2. Dada uma aplicação f : V, —> R”, de classe C* no aberto V, C R”, 
seja V = ((x, f(x); x € Və} C R”™ o gráfico de f. A aplicação ọ : V, > V, 
dada por p(x) = (x, f(x)), é uma parametrização de dimensão m e classe C* do 
conjunto V C R”*". Com efeito, se chamarmos de TI : R”™” —> R” a projeção 
sobre as m primeiras coordenadas, a igualdade II o y = idy, mostra que q é um 
homeomorfismo, cujo inverso é a restrição II|V e, em virtude da Regra da Cadeia, 
que T - g'(x) = idgm, logo q (x): R” —> R”+” é injetiva, para todo x € V,, 
portanto q é uma imersão. < 


Exemplo 3. Uma imersão q : V, —> V pode muito bem ser bijetiva sem ser um 
homeomorfismo, logo não é uma parametrização de V. Um exemplo disso pode 
ser obtido tomando a restrição do caminho f, visto no Exemplo 1 acima, ao 
intervalo (—1, +00) C R. O caminho q : (—1, +00) —> R?, dado por p(t) = 
(t° —t, t”), é uma imersão CO bijetiva do intervalo (— 1, +00) em R? mas não é uma 
parametrização da sua imagem V pois a função inversa q! : V > (—1, +00) é 
descontínua no ponto (0, 1) e V. Com efeito, se (t,) é uma segiiência decrescente 


de números reais com lim t, = —1, vemos que lim q (t,) = (0, 1) = (1) sem que 
se tenha lim t, = 1. < 
A 
(t3 - t, t?) 
Figura 2. 
Exemplo 4. Seja N = (0,...,0,1) o polo norte da esfera unitária S” = 


{x ER: (x,x) = 1}. Pondo V = S” — {N} e V, = R”, o homeomorfismo 
q: Və — V, inverso da projeção estereográfica £, (vide Exemplo 16, Capítulo 1), 
é uma parametrização. Evidentemente, p é de classe C% e sua inversa É : S” — 
{N} > R” é a restrição de uma aplicação C% (cujo domínio é o aberto U = {x € 
R+; x41 Æ 1)). A igualdade £ o q = ida» mostra, via Regra da Cadeia, que y 
é uma imersão, o que completa a verificação. < 
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2 Superfícies diferenciáveis 


Um conjunto M C R” chama-se uma superfície de dimensão m e classe C* quando 
todo ponto p € M está contido em algum aberto U C R” tal que V = U AM 
é a imagem de uma parametrização q : V, —> V, de dimensão m e classe C*. O 
conjunto V é um aberto em M, chamado uma vizinhança parametrizada do ponto 
p. Escreve-se m = dim -M. 


Observação. Na definição acima, supõe-se tacitamente k > 1. Mas teria sentido 
considerar superfícies de classe C°. Bastaria admitir “parametrizações de classe 
C°”, que são meramente homeomorfismos q : Vò —> V de abertos V, C R” 
sobre abertos V C M. As superfícies de classe C° são estudadas na Topologia. 
Seu interesse em Análise é reduzido, principalmente porque não possuem espaços 
tangentes. 

Quando dim -M = 1, a superfície M chama-se uma curva. 


Exemplo 5. Como Rº = {0} reduz-se a um ponto, uma superfície de dimensão O 
em R” é simplesmente um conjunto discreto. No extremo oposto, as superfícies 
de dimensão n em R” são os subconjuntos abertos, pois a imagem de uma para- 
metrização de dimensão n em R” é aberta, em virtude do Teorema da Aplicação 


Inversa. < 


Exemplo 6. A esfera S” é uma superfície de dimensão n e classe C% em R”*1. 
Com efeito, a inversa da projeção estereográfica é uma parametrização q : R” —> 
S” — {N}. Para obter uma vizinhança parametrizada do polo norte N, basta con- 
siderar —ọ : R” > S” — {N*}, onde N* = —N é o polo sul. < 


Exemplo 7. O produto cartesiano M x N de duas superfícies M C R” e N C 
R* é uma superfície em R”** pois se ọ : Vy > VcMey:W > Wc 
N são parametrizações então £ : V, x Wo > V x W C M x N, dada por 
E(x, y) = (p(x), Y (y)), é uma parametrização. Evidentemente, dim(M x N) = 
dim M +dim N. Em particular, o toro m-dimensional T” = Six... x S!, produto 
cartesiano de m círculos, é uma superfície de dimensão m e classe C% em R”. < 


Exemplo 8. O gráfico de uma aplicação f : U —> R”, de classe C* no aberto 
U C R”, é uma superfície M = f(x, f(x)) € RºM;x E U}, de dimensão 
m e classe C% em R”+”, Com efeito, M é a imagem da única parametrização 
g: U > M, glx) = x, f(x). < 


Ser uma superfície é uma propriedade local: se todo ponto p € M está contido 
num conjunto V C M, aberto em M, o qual é uma superfície de classe C* e 
dimensão m, então o conjunto M C R” é uma superfície de dimensão m e classe C*. 
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Em particular, se M é localmente o gráfico de uma aplicação f : V, — R”, de 
classe C* num aberto V, C R”, então M C R”+” é uma superfície de classe C* e 
dimensão m. Assim, por exemplo, as hiperfícies, conforme definidas no Capítulo 
4, são superfícies de dimensão n — 1 em R”. 

Quando M C R” é uma superfície de dimensão m, costuma-se dizer que M 
tem co-dimensão n — m. Portanto, hiperfícies são superfícies de co-dimensão 1. 

No teorema abaixo, M é uma superfície de dimensão m e classe C% em R”. Por 
“uma projeção II : R” — R”” entendemos a aplicação dada por I (x1, ... , Xn) = 
(Xi -.. » Xiy ), definida a partir da escolha de m índices i} < ... < im, compreen- 
didos entre 1 en. 


Teorema 1. Sejay:V, > V uma parametrização em M. Para cada p = 
p(xo) € V existe uma projeção II : R” —> R” tal que Il o q aplica um aber- 
to Zo, com Xo € Zo C V, difeomorficamente sobre um aberto W, C R”. 


dpi 
Demonstração. A matriz jacobiana ES) e M(n x m) tem m linhas li- 
Xj 


nearmente independentes, de índices i; < i <... < im Essas linhas for- 
. ; dpi ; 
mam a matriz m x m invertível J = É * (xo) | e os índices ip definem uma 
X . 
j 


projeção TI : R” —> R”. Observando que J é a matriz jacobiana da aplicação 
Hoy: V — R”, o Teorema 1 resulta imediatamente do Teorema da Aplicação 
Inversa. 


Figura 3. 


Corolário 1. Toda superfície de classe C* é localmente o gráfico de uma aplicação 
de classe CH. 


Com efeito, usando a notação do Teorema 1, escrevamos os elementos de R” 
sob a forma z = (y, y’), onde y = TI (z). Ponhamos também W = q(Z,). Então 
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a aplicação y = ọ o (Moq)!:W, —> W é uma parametrização. Além disso, 
para todo y e W,, tem-se 


MYO) =op) (Moog!) =», logo Y(y) = Q, y’). 


Assim, W é o gráfico da aplicação de classe C*, f : W, — R”"™, dada por 
fo) =y. 


Corolário 2. Seja M C R” uma superfície de classe C* e dimensão m. Se uma 
aplicação f : V, > R”, de classe C* no aberto V, C R?, tiver sua imagem 
f (Vo) contida na vizinhança W C M, parametrizada por Y : W, —> W, então 
yl o f: V, > R” é uma aplicação de classe C*. 


Com efeito, para cada ponto x, e Vo, com f(x,) = Y (yo), existe, pelo Teo- 
rema 1, uma projeção II : R” —> R” tal que T o y é um difeomorfismo de uma 
vizinhança de y, sobre um aberto de R”. Então, numa vizinhança de x,, podemos 
escrever 


Wlof=(Moy)!oTof, 


logo y”! o f é de classe C*. 

Sejam yY : Vo > V ey: W, —> W parametrizações numa superfície M, 
de classe C* e dimensão m. Suponhamos que V N W Æ Ø. Então todo ponto 
p € VOW pode escrever-se como p = (x), x E V), oucomo p = Y (y), y € Wo, 
isto é, pode ser representado pelos m parâmetros que são as coordenadas de x ou 
pelas m coordenadas de y. A correspondência x H> y, definida pela relação 


g(x) = y (y), é a aplicação 


Yog: gp (VW — YV Nnw), 
chamada mudança de parametrização. 


Corolário 3. Numa superfície de classe C*, toda mudança de parametrização 
g7! o ọ é u difeomorfismo de classe C*. 


Com efeito, pelo Corolário 2, y”! o œ é uma aplicação de classe C*. Pelo 
mesmo motivo, sua inversa q”! o y também é de classe C*. Logo y”! o q é um 
difeomorfismo. 


Exemplo 9. O conjunto M = {(x, x4); x E R}, gráfico da função f : R — 
R, f(x) = xt’ é uma curva de classe C! em R°: a aplicação ọ : R > R?, 
dada por q(x) = (x, xt’), é uma parametrização (global) de M. Cabe observar, 
porém, que se V C M contém o ponto (0, 0), não pode existir uma parametrização 
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Figura 4. 


W: V —> V de classe C% com k > 1. Com efeito, se uma tal y existisse 
então o próprio conjunto V seria uma curva de classe C* logo, pelo Corolário 
1, uma vizinhança W do ponto (0,0), com W C V, seria o gráfico de uma 
função g: W, — R, de classe C*. Neste caso, para todo x € W, teríamos 
(x, g(x)) E WC M, logo g(x) = xt’, mas xt’? é apenas de classe C!. Assim, 
M n ao é uma curva de classe C°. < 


3 O espaço vetorial tangente 


Seja p um ponto da superfície M, de dimensão m e classe C* em R”. O espaço 
vetorial tangente a M no ponto p é um subespaço vetorial T,M C R”, que pode 
ser visto sob dois aspectos: 


1) T,M éo conjunto dos vetores-velocidade v = å’ (0) dos caminhos diferen- 
ciáveis À : (—£€, €) > M, tais que à (0) = p. 


2) TM = g'(x): R” é a imagem da derivada q'(x,) : R” —> R”, onde 
q: Və —> V é uma parametrização em M, com (xo) = p. 


A primeira descrição de T, M é intrínseca (não depende de escolhas arbitrárias) 
mas não deixa claro que se trata de um subespaço vetorial de R”. Pela segunda 
descrição, T,M é obviamente um subespaço vetorial de R” mas não é evidente que 
para outra parametrização y : W, —> W, com Y (yo) = p, se tenha Y’ (yo): R” = 
P'o): R". 

As dúvidas ficarão sanadas se mostrarmos que os conjuntos definidos em 1) e 
2) são o mesmo. Para ver isto, comecemos com o vetor-velocidade v = A'(0) de 
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um caminho diferenciável À : (—s,e) > M, com À(0) = p. Restringindo e, se 
necessário, podemos admitir que a imagem de À esteja contida na imagem V de 
uma parametrizaçãoy : Vo > V C M, com q(x,) = p. Então, pelo Corolário 2, 
u=y !0A:(-8,€) > V, é um caminho diferenciável em R”, com u(0) = xo. 
Pondo u = u'(0), temos 


P' (Xo) cu = P' (X0) (po A) (0) = (pop! o (0) = 10) = v. 


Portanto todo vetor v = à’ (0) pertence à imagem g'(xo) - R” de R” pela derivada 
de alguma parametrização p : V, —> V, com p € V. 

Reciprocamente, se v = g' (xo) -u então, como u = w (0), onde u : (—€, £) > 
V, é dado por u(t) = xo + t - u, temos v = A (0) com à : (—€, €) > V, A(t) = 
p(u(t)), logo v está no conjunto definido em 2). 

Como toda parametrização y é uma imersão, a derivada q (x9): R” —> R” 
é uma transformação linear injetiva, logo sua imagem qy'(x,) -R” = T,M é um 
subespaço vetorial m-dimensional de R”. 

Os vetores 


dy j dy ; 
— (xo) = Q (xo) < €1, ... , =— (x0) = P (Xo) ` em 
dx1 Xm 


formam uma base de T,M, chamada a base associada à parametrização q. 

A seguir estenderemos, para superfícies quaisquer, o Teorema 3 do Capítulo 4, 
provado para o caso de co-dimensão 1. 

Seja f : U — R” uma aplicação diferenciável, definida no aberto U C R”. 
Um ponto c e R” chama-se um valor regular de f quando, para todo x € U 
tal que f(x) = c, a derivada f'(x): R”™” —> R” é uma transformação linear 
sobrejetiva. 

Observe-se que, para n = 1, a transformação linear f'(x): RI > R é 
sobrejetiva se, e somente se, é diferente de zero, ou seja, grad f(x) Æ 0. (Vide 
Exemplo 2, Capítulo 5.) Portanto esta definição de valor regular estende a que foi 
dada anteriormente. 


Teorema 2. Seja c e R” um valor regular da aplicação f : U —> R”, de classe 
C* no aberto U CR"*". A imagem inversa M = f7! (c) = {x € U; f(x) = c} é 
uma superfície de classe C* e dimensão m em R"*". O espaço vetorial tangente 
T,M, em cada ponto p € M, é o núcleo da derivada fp): R"”™ > R". 


Demonstração. Pelo Corolário 4, Capítulo 6, M = f-!(c) é localmente o gráfico 
de uma aplicação de classe C*, logo é uma superfície. Além disso, para p € 
M, todo vetor v € T,M é da forma v = A'(0), onde À : (—s,e) > M é um 
caminho diferenciável, com A(0) = p. Logo f'(p)-v = (f o ày (0) = O pois 
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P4 


foà: (~e, £) > R” é constante, igual a c. Portanto T,M esta contido no núcleo 
de f'(p). Como f'(p) é sobrejetiva, esse núcleo tem dimensão m e então é igual 
aT,M. 


Exemplo 10. Seja O (R”) o grupo ortogonal, formado pelas matrizes x e M (n x 
n), tais que xx! = I, (matrizes ortogonais). Usaremos o Teorema 2 para mostrar 
que O(R”) é uma superfície (compacta) de classe C% e dimensão n(n — 1)/2 
em R”. Seja então f : M(n x n) —> S(R") a aplicação definida no conjunto 
das matrizes n x n, com valores no conjunto das matrizes simétricas n x n, pela 
fórmula f(x) = x- x”. Já costumamos fazer a identificação M(n x n) = R”, 
Agora identificaremos S(R”) com R"("+D/? pois uma matriz simétrica n x n fica 
determinada pelos seus elementos da diagonal e acima dela, em número de n + 
(n—1)+---+2+1 = n(n + 1)/2. Assim, escrevemos f : R”? > R"0+D/2 e 
temos O@R”) = f-!(I,). Resta apenas verificar que a matriz identidade I, é um 
valor regular de f. Tomando um ponto arbitrário de f~! (I„), isto é, uma matriz 
ortogonal x, sabemos que a derivada f(x) : R? > RºMtD/2 é à transformação 
linear que toda v € R” faz corresponder f(x) .v = v.x? +x-v7. Para 
provar que f'(x) é sobrejetiva, seja dada s € R"("+1)/2. Tomando v = sx/2 temos 
f'(x) -v = sx -x7 /2 + xx" - s/2 = s/2 + s/2 = s. (Lembre ques” = s.) Vale 
dim OR”) = n? — n(n + 1)/2 = n(n — 1)/2. < 


Observemos, em relação ao Exemplo 10, que o espaço vetorial tangente a O (R”) 
no ponto L, é o conjunto das matrizes anti-simétricas n x n, isto é, matrizes v tais 
que v +v” = 0. Com efeito, sendo a derivada f(,) : R? — Rºt+D/2 dada por 
ve v- If +I-vl=v+4v”, vemos que o núcleo de f'(L,), ou seja, o espaço 
vetorial tangente a O (R”) no ponto L,, é o conjunto das matrizes anti-simétricas. 


Exemplo 11 (Ainda uma vez a esfera). Seja f : R"+! —» R definida por f(x) = 
(x,x). Como f(x) -v = 2(v,x), vemos que, para todo x £ O em R”+!, a 
derivada f'(x) : R”+! —> Ré 0, logo é sobrejetiva. Como f(x) =0 < x = 0, 
conclui-se que todo c £ 0 em R é valor regular de f. Sec < 0 então f7! (c) = Ø. 
Se c > 0 então f~! (c) é a esfera de centro O e raio /c. a 


4 Superfícies orientáveis 


Como no caso de hiperfícies (co-dimensão 1), tratado no Capítulo 4, cabe observar 
que nem toda superfície em R” pode ser obtida como imagem inversa de um valor 
regular. 

Com efeito, se M = f!(c) é a imagem inversa do valor regular 
c e R” pela aplicação f : U —> R”, de classe CÊ no aberto U C R”+ en- 
tão, chamando de fi, ... , fn: U —> R as funções-coordenada de f, vemos que 
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grad fj,...,grad fn : U — R”+” são campos de vetores de classe C*-!, com as 
seguintes propriedades: 


1) Para todo x € M, os vetores grad fi(x),..., grad fa (x) são ortogonais ao 
espaço vetorial tangente TyM. (Diz-se então que os grad f; são campos de 
vetores normais a M.) 


2) Para todo x € M, os vetores grad fi(x),...,grad fa (x) são linearmente 
independentes. 
A afirmação 1) resulta do fato de que, para cada i = 1,...,n, a função 


fi: U —> R é constante ao longo de M. Todo vetor v € TM, parax e M 
qualquer, é o vetor-velocidade v = A'(0) de um caminho À : (—€£, €) > M, logo 
fio à: (~e, £) > R é constante. Daí, (grad f; (x), v} = (fio AY (0) = 0. 

Por sua vez, a afirmação 2) é equivalente a dizer que c é um valor regular 
de f, pois grad fı (x), ... , grad fa (x) são os vetores-linha da matriz jacobiana 

l 
0X; 
para todo x € M, tem posto n, logo f'(x) : R"*” —> R” é sobrejetiva. 

Mas nem toda superfície M C R”*”, de co-dimensão n, admite n campos 
contínuos linearmente independente de vetores normais. Uma condição necessária 
para isto é que M seja orientável, conforme mostraremos agora. 

Um atlas numa superfície M é um conjunto de parametrizações p : V —> V 
cujas imagens V cobrem M. Duas parametrizações py: V —> Vey:W > W 
dizem-se compatíveis quando VN W = Ø ou quando V AW £geylo 
pvp: MVNW) > yr (VN W) tem determinante jacobiano positivo em todos 
os pontos x e q !(VNW). Um atlas A na superfície M chama-se coerente quando 
duas parametrizações quaisquer y, y e A são compatíveis. Uma superfície M 
chama-se orientável quando admite um atlas coerente. 


(x)| e M(n x (m+n)). Sua independência linear significa que esta matriz, 


Teorema 3. Se uma superfície M C R"*", de co-dimensão n, admite n campos 
contínuos linearmente independentes de vetores normais vi, ... , vn: M — R”™ 
então M é orientável. 


Demonstração. Seja A o conjunto das parametrizações p : Vy —> V em M tais 
que V, é conexo e, para todo x € V,, a matriz 


dp 


ə 
(x)= Zo, a 


(x), vil), ..., wea) ; 


cujas m +n colunas são os vetores de R”™” aí indicados, tem determinante positivo. 
Como V, é conexo e os campos v; são contínuos, para ser y e A basta que 
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det ®(x) > O para algum x € V. Se for det d(x) < 0, escrevemos x* = 
(—x1, X2, ... , Xm) quando x = (x1, X2, ... , Xm) € pomos VÍ = {x*ř;x € Vo). 
Então q* : V*ž — V, dada por q*(x) = o (x*), é uma parametrização cuja imagem 
ainda é V mas det 6*(x) > 0. Isto mostra que A é um atlas em M. Sejam 
g, € A, com ọ : V, —> Vo:W>WeVNnWz£g. Pondoé = yo 
p:p(VNW) > y~!(V N W), temos p = Po E. A Regra da Cadeia nos dá, 
paraxey M(VNW)ey= EM): 


dp m ay l 
TA = DG, j=1,...,m, 


onde a(x) = [a;;(x)] é a matriz jacobiana de É no ponto x. Em termos matriciais, 
estas igualdades significam que 


a(x) 0 


(x)= W(x)-. A(x), onde A(x) = | 0 d ce M((m +n) x (m +n)) 


e I = matriz identidade n x n. Então det ®(x) = det W(x) - det a(x) e daí 
det a(x) > 0. Logo as parametrizações y, y € A são compatíveis. O atlas A é 
coerente e a superfície M é orientável. 


Corolário 4. Se M = f”!(c) éaimagem inversa de um valor regular da aplicação 
f: U —> R’, de classe C% no aberto U C R"*", então M é uma superfície m- 
dimensional orientável. 


Assim, por exemplo, o grupo ortogonal O (R”) é uma superfície orientável. 

Para co-dimensão 1, vale a recíproca do Teorema 3. Ela resulta da existência 
do produto vetorial w = vı X ... x Vn de n vetores em R$ que descreveremos 
agora. 

O produto w = vı x... x v, é igual a zero quando v4, ... , Vn são linearmente 
dependentes. Caso contrário, w é ortogonal ao subespaço gerado por esses n 
vetores, tem comprimento igual ao volume do paralelepípedo n-dimensional por 


eles determinado e seu sentido é dado pela condição det [v1, ... , Vn, w] > 0. 
Em termos formais, sejam = [v,,..., Vn] a matriz n x (n + 1) cujas colunas 
são os vetores dados. Para cada i = 1,... , n, indiquemos com m; a matriz n x n 


obtida de m omitindo a i-ésima coluna. Então o produto vetorial w = vi, X ...XUn 
é definido por 


n 
w=v X... X Wn = X (—D*detm;-e;. 


i=l 
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O desenvolvimento de Laplace de um determinante em relação à sua última 
coluna mostra que, para todo vetor z € R”+!, tem-se 


CVX esi X uv, z)=det[v,,..., vn, 2]. 

Esta última igualdade mostra que, de fato, vı x... x Vn = w é ortogonal a 
Ul, -.. , Un, que é zero quando esses vetores são linearmente dependentes e que 
det [v1,..., vn, wW] > O no caso contrário. Além disso, sabe-se que o volume 
(n + 1)-dimensional do paralelepípedo cujas arestas são v1, ... , Un, W É O produto 
do volume n-dimensional V, de sua base (a qual tem v,,..., v, como arestas) 


pelo comprimento de sua altura, que é |w], pois w é ortogonal a essa base. Logo 
|w] É Va = vol [vi, Pio So Bo PO Un, w] = | det [vi, EIN F Un, w]]| 
2 
= (VX... X un, wW) = |wlí. 


Simplificando, vem |w| = V,, ou seja, o comprimento do produto vetorial vı x 
... X Vn É O volume n-dimensional do paralelepípedo cujas arestas são os vetores 
VI, ...5 Va. 

Concluindo estas considerações sobre o produto vetorial, mostraremos agora 
que se fui,... , Un} e fvy,..., Un} são bases do subespaço vetorial E c R”+! 
e se a = [a;;] é a matriz de passagem da primeira para a segunda, isto é, v; = 

n 
5D aijui(j = 1, TEA n), então 
i= 


VX... X V, = deta -u X... X Un. 


Com efeito, como ambos estes produtos vetoriais são ortogonais ao subespaço 
E c R+, que tem co-dimensão 1, eles são múltiplos um do outro. Então, 
fixando os vetores u1, ... , Un, definimos duas formas n-lineares alternadas f, A 
em E, pelas condições 


VI X...Xxu= If, ,Un) UI X...X Un 


n 
e A(vi,..., Vn) = det [a;;] se vj = Ý am, J e O he 
i=1 
Sabe-se (v. “Álgebra Linear”, pág. 261) que as formas n-lineares alternadas 
num espaço de dimensão n constituem um espaço vetorial de dimensão 1. Logo 
existe c € R tal que f = c. A, ou seja, f (vi, ... , Un) = c -det [a;;] para quaisquer 
Vi, ...,Un E E. Tomando vı = u1,... , Un = Un, temos f(ui,..., Un) =le 
A(u,,... sun) = 1, logo c = 1 e daí f = A, isto é, 


v, X... X Un =deta- uX... X Un, 


n 
onde a = [a;;] e vj= ) Aijui, EO NR [e 
i=l 
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Teorema 4. Toda superfície orientável de co-dimensão 1 admite um campo con- 
tínuo de vetores normais não-nulos. 


Demonstração. Seja M C R”+! orientável de dimensão n. Para toda parametriza- 
çãoy : V, — V pertencente ao atlas coerente A, o qual caracteriza a orientabilida- 
de de M, definamos o campo contínuo de vetores normais unitários u : V > R”+! 
pondo, em cada ponto p e V, 


Fo) 
< (O). x = g7! (p) € Vs, e u(p) = w(p)/lw(p)] . 


fo) 
wp) = F20) Xu. x 
X1 


Se y : W, —> W for outra parametrização pertencente a A então q e y são 
compatíveis. Assim, se V N W £ 9, para todo pe V N W, com 


ð ð 
O aR X 
yı dYn 


E O), y=Y (p) E€ Ws, 


como vimos acima, temos w(p) = det a-z(p) onde a é a matriz jacobiana, no ponto 
x, da mudança de parametrização Y7! o g. Logo det a > 0 e, consegiientemente, 


w(p) = z(p) Es 
jw(p)| Iz(p)| 


Deste modo, o campo unitário normal u : M —> Rº+ está bem definido e é, 
evidentemente, contínuo. 


O Teorema 4 mostra que a definição de hiperfície orientável dada no Capítulo 
4 é compatível com a definição geral dada aqui. 


Exemplo 12. Todo subconjunto aberto A de uma superfície orientável M é ainda 
uma superfície orientável. Com efeito, se A é um atlas coerente em M então 
as restrições p | (Və N q (A) > V N A das parametrizações p: V, > V 
pertencentes a A, com VN A Æ Ø, formam um atlas coerente em A. Portanto 
se uma superfície bidimensional M contém uma faixa de Moebius então M não é 
orientável. < 


Exemplo 13. O produto M x N de duas superfícies M e N é uma superfície 
orientável. Com efeito, se A e P são atlas coerentes em M e N respectivamente 
então as parametrizações do tipo p x €: V, x W —> V x W, definidas por 
(p x E&x, y) = (p(x),E(y)), onde py € A e É e B, formam um atlas em 
M x N, o qual é coerente pois (y x ¢)™! o (g x £) = (YT! og) x (7! oE)eo 
determinante jacobiano de (Y7! o œ) x (¢7! o E) é o produto dos determinantes 
jacobianos de y !opet”! o£. Reciprocamente, se o produto M x N é orientável 
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então tomamos um atlas coerente A em M x N e fixamos, de uma vez por todas, 
uma parametrização É: Zo — Z em N. O conjunto B das parametrizações 
: V > V em M tais que ọ x £: V, x Zo > V x Z é compatível com 
todas as parametrizações pertencentes a A é certamente em atlas em M. Além 
disso, se 9 : V > V e yY : W, —> W pertencem a B, com V N W Æ Ø, pondo 
aœ = (Y x £)! o (p x E), vemos que œ = (Y7! o p) x id, logo o jacobiano de 
a, que é positivo, é igual ao de Y~! o q. Logo B é coerente e M é orientável. Do 
mesmo modo se mostra que N também é orientável. < 


Exemplo 14. Em virtude do Teorema 3, a esfera S” é uma hiperfície orientável em 
R"+1, pois admite o óbvio campo contínuo de vetores normais unitários u : S” —> 
Rº* u(p) = p. Em particular, o círculo S! C R? é orientável logo, pelo Exemplo 
13, o toro n-dimensional T” = S! x... x S! (n fatores) é uma superfície orientável 
em R”. < 


O lema a seguir serve de fundamento para o Exemplo 15. 


Lema 1. Sejam A um atlas coerente na superfície orientável M e ọ : V > V 
uma parametrização da vizinhança conexa V em M. Para qualquer parametriza- 
ção £ : W, —> W pertencente a A, com V OW £ Ø, o determinante jacobiano 
det -J (E7! o y)(x) não muda de sinal quando x varia em g7! (V N W). 


Demonstração. O conjunto A dos pontos p = (x) € V tais que existe uma 
parametrização É : W, —> W, pertencente ao atlas A, com p = E(w), w € W, 
e det J (ET! o q)(x) > 0, é aberto em V. Analogamente, é aberto o conjunto 
B dos pontos q € V para os quais existe ¢ : Zo > Z,¢ € A, com ¢(z) = p 
para algum z € Z, e det- J(¢7! o q)(x) < 0. É claro que V = A U B. Além 
disso, A N B = & pois se existisse algum ponto p = (x) € A N B, teríamos 
as parametrizações É: W, —> W, ¢ : Zo > Z pertencentes a A, com E(w) = 
¢(z) = pe (E7! o g) o (t7! o o)! = E7! ot, logo o determinante jacobiano de 
ET! o £ no ponto z seria o produto dos determinantes det -J (£7! o q)(x) > 0e 
[det J (£7! o pw] < 0. Então teríamos det - (E! o ¢)(z) < 0 e o atlas A não 
seria coerente. 


Exemplo 15. Seja M C Rº o conjunto das matrizes 2 x 3 de ponto 1. Cada 
elemento m € M será escrito sob a forma m = [u, v], onde os vetores u, v € R? 
são as suas linhas. Temos M = UUV, onde U é o conjunto das matrizes m = [u, v] 
de posto 1 tais que u + 0, enquanto V C M é definido pela condição v £ 0. Pondo 
U, = R x (R? — (0) as aplicações y : U, > U e y : Us —> V, definidas por 
p(t,u) = [u,tu] e Y(t, v) = [tv, v], são parametrizações C%. A interseção 
U N V é o conjunto das matrizes de posto 1 com ambas as linhas não-nulas, logo 
gT! (U N V) = Y~!(U N V) = R — {0} x (R? — {0}) tem duas componentes 
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conexas: Rt x (R? — {0} e RT x (R? — [0)). A mudança de parametrização É = 
vlop:p MUNV) > y~! (U N V)é dada por E(t, x,y, z) = (1/t, tx, ty, tz). 
Sua matriz jacobiana em cada ponto (t,x,y, Dep MUNV)é 


1 
f 
JEt, x yz) =| x t 0 
y 0 
L z 0 "l 
e seu determinante é igual a —t. A mudança de parametrização £ = Y7! o g tem, 
portanto, jacobiano negativo em R* x (R? — {0}) e positivo em R x (R3 — {0}. 


Segue-se do Lema 1 que M é uma superfície C”, não-orientável, de dimensão 4 
em Rº. < 


0 


© 
+ o o 


5 Multiplicadores de Lagrange 


Estenderemos agora, para co-dimensão n qualquer, o método dos multiplicadores 
de Lagrange, apresentado no Capítulo 4 no caso em que a superfície q” !(c) tem 
co-dimensão 1, logo há apenas um multiplicador. 

São dadas uma superfície M, de dimensão m e classe C*, e uma função f : U — 
R, de classe C* no aberto U, com M C U cC R”*. Quer-se determinar o conjunto 
dos pontos críticos da restrição f|M. 

Diz-se que p e M é um ponto crítico da restrição fIM quando, para todo 
caminho diferenciável À : (—£, €) > M, com A(O) = p, tem-se (f o àY (0) = 0. 

Como À'(0) = v € T,M e portanto 


ð 
(fo A(O) = Lp) = (grad f (p), v), 


concluímos que p € M é ponto crítico de f|M se, e somente se, grad f (p) 
é ortogonal a todos os vetores v € T,M, tangentes a M no ponto p, ou seja, 
grad f (p) € [TM]. 

Se p € M é um ponto de mínimo (ou máximo) local da restrição f|M e 
à : (—£, €) > M é um caminho diferenciável com à (0) = p então O é um ponto 
de mínimo (ou máximo) local de f o À : (—e, £) > R, logo (f o àY (0) = 0 e 
então p é um ponto crítico de f|M. 


Exemplo 16. Suponhamos que a superfície M C R”™” seja um subconjunto fe- 
chado. Então, fixado um ponto a € R”t”, existe, entre os pontos de M, (pelo 
menos) um ponto p situado a uma distância mínima de a. Considerando a fun- 
ção f: R”™ — R, dada por f(x) = |x —al?, vemos que p é um ponto de 
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mínimo da restrição f|M. Logo grad f(p) é um vetor ortogonal a T,M. Mas 
grad f (p) = 2- (x — a). Portanto os pontos p e M situados à distância mínima 
do ponto a são aqueles tais que o vetor p — a é ortogonal a T,M. Evidentemente, 
vale o mesmo para os pontos de M mais afastados de a, caso existam (como ocorre 
quando M é compacta). 

Suponhamos agora que a superfície M = y”!(c) seja obtida como imagem 
inversa do valor regular c da aplicação q: U —> R”, de classe C* no aberto 
U C R”t", Se escrevermos p(x) = (pi(x),..., Pn(x)), a afirmação de que c 
é um valor regular de q significa que os vetores grad q; (x),... , grad pn (x) são 
linearmente independentes para todo x € U tal que g(x) = c. 

Com efeito, esses n vetores são as linhas da matriz jacobiana Jy(x) e M(n x 
(m + n)), a qual tem posto n por ser a matriz da transformação linear sobrejetiva 
g'(x): RS R”. 

Além disso, conforme já vimos no início da seção 4, em todo ponto x € M = 
q Hc), os vetores grad pi(x),..., grad n(x) são ortogonais a TyM, portanto 
formam uma base do complemento ortogonal [T} M]+. < 


Podemos então enunciar o 


Método dos multiplicadores de Lagrange. Sejam f : U > R uma função de 
classe C* no aberto U CR"*"eM = q” !(c) a imagem inversa do valor regular 
c pela aplicação q: U —> R”, de classe C*. A fim de que p € M seja um ponto 
crítico da restrição f |M é necessário e suficiente que existam números À 1, ... , An 
tais que grad f (p) = A grad pı (p) ++: + An - grad pn (p). 

Os números À4,..., A, são chamados multiplicadores de Lagrange. 

De fato p é ponto crítico de f|M se, e somente se, grad f(p) é ortogonal a 
T M. Como {grad ọı (p), ... , grad ya (p)) é uma base do complemento ortogonal 
de T,M em R”+”, dizer que grad f (p) € [T,M]+ equivale a afirmar que grad f (p) 
é combinação linear dos gradientes grad gı (p), ... , grad pn (p). 


Seja c = (c1, ... , Cn). Para encontrar os pontos críticos p da restrição fIM, 
devemos resolver o sistema abaixo, de m + 2n equações com m + 2n incógnitas. 
(As incógnitas são as m + n coordenadas de p mais os n multiplicadores À;.): 


QD = eps Pnp) = Cn 
grad f (p) = ài - grad pi (p) +--+ + àn < grad pn (p). 


A última equação acima é vetorial. Ela equivale às m + n equações numéricas 


of dp IPn , 
(p) = M EP) + e Hn elp), j=l, mn. 
0X ; 0x j 9X ; 
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Exemplo 17. Seja 4: R” —> R” uma transformação linear. Defina f : R” > 
R” > Rpondo f(x,y) =(Ax,y)=(x,4*y)=> ajxyill<i<ni=< 
j < m). Considerando o valor regular (1, 1) da aplicação ọ : R” x R” > R?, 
dada por (x, y) = qxl?, |"); seja M = sl xs! = q-1(1,1). Vejamos 
quais são os pontos críticos da restrição f|M. 

Para todo (x, y) € R” x R”, temos grad f(x,y) = (4*.y,A-x) € R” x R”. 
Além disso, p = (91, #2), com grad gı (x, y) = (2x, 0) e grad g2 (x, y) = (0, 2y). 
Por conveniência, tomemos à/2 e u/2 como multiplicadores de Lagrange. Um 
ponto p = (x, y) E M é crítico para f|M se, e somente se, 


À u 
grad f (x, y) = 3 grad pı (x, y) + 7 grad p2 (x, y), 


ou seja, (A*y, Ax) = (àx, uy). Isto nos dá A - x = u - y e A*y = à - x, donde 
u= (Uy, y) = (Ax, y) = (x, A*y) = (x, x) =À. 

Portanto, os pontos críticos de f|M são os pontos (x, y) € S”! x S”! tais 
que Ax = ày e A*y = àx para um certo À € R. Notemos que então À = f(x, y) 
e que zlx = Azly. Assim, se escrevermos E = {z € R”;(z,x) = 0} = 
complemento ortogonal de x em R”, e F = complemento ortogonal de y em R”, 
a transformação linear A : R” —> R” aplica E em F. 

Seja então pı = (u1, v1) € S”! x S”! o ponto em que a função f assume 
seu valor máximo em S”! x S”! : f (u1, v1) = A. Então pı é ponto crítico de 
fIM. Temos Au, = àv; e A*v = Ay u1. Como f(x, —y) = — f(x, y), vemos 
que à; > 0. Se A Æ 0 então f não é identicamente nula em M, logo À, > 0. < 


Em seguida consideremos A como uma transformação linear A : E —> F, agora 
com dim E = m — 1 e dim F = n — 1. Prosseguindo por indução, chegaremos ao 
seguinte resultado: 


Teorema dos Valores Singulares. Seja A : R” > R” uma transformação linear 


de posto r. Existem bases ortonormais {u1, ... sum) C R” e {v1,... , Un} C R” 
tais que Au; = Ajv;e A*v; = Aju; onde à; > 0 parai = 1,... ,r e à; = 0 para 
i>r+l1. 


Os números À, > 0,...,A, > 0 são chamados os valores singulares de A. 


Capítulo 8 


Integrais Múltiplas 


1 A definição de integral 


P4 


Um bloco n-dimensional A C R” é um produto cartesiano 
A= | [id b] = laibi x x lan, bi] 
i=l 


de n intervalos compactos [a;, bi], chamados suas arestas. O produto cartesiano 
n 
JI (ai, bi) dos intervalos abertos (a;, bi) chama-se bloco n-dimensional aberto. 
i=1 


Quando todas as arestas do bloco A têm o mesmo comprimento a = b; — a;, diz-se 
que A é um cubo n-dimensional. Quando n = 1, os blocos são simplesmente 
intervalos. Se n = 2, o bloco reduz-se a um retângulo e o cubo a um quadrado. 


Uma face do bloco A = || [a;, b;] é um conjunto do tipo F = |] L; onde, 


i=1 
para cada i = 1,... , n, tem-se L; = (a;), Li = {b;} ou L; = (a;, bi}. Diz-se que 
a face F tem dimensão r quando exatamente r dos fatores L; são iguais a [a;, b;]. 
As faces de dimensão zero, isto é, os pontos da forma v = (c1,... ,Cn), onde 
ci = aj OU c; = b; para cada i > 1,... , n, são chamadas os vértices do bloco. 
n 
O volume n-dimensional do bloco A = || [ai, bi] é, por definição, o 
ni 
x t 
produto |] (b; — ai) dos comprimentos de suas arestas. Este é também o volume 
n 
do bloco aberto |] (a;, b;). 
e 
i n 
Uma partição do bloco A = T] [a;, bi] é um produto cartesiano P = P, x 


i=l 
--- X Pa, onde cada P; é uma partição do intervalo [a;, b;] (cfr. Vol. 1, Cap. 10, 
82). Diz-se que a partição O = Q; x--: x Qn refina a partição P quando se tem 
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P C Q. Isto equivale a dizer que Pi C O1,...,P, C On. 

A partição P decompõe o bloco A numa reunião de sub-blocos B = 1, x--- In, 
onde cada 1; é um intervalo da partição P; de [a;, b;]. Estes sub-blocos B C A 
chamam-se os blocos da partição P. Escreve-se então B € P. Sea partição Q 
refina P então cada bloco de P é a reunião dos blocos de Q nele contidos. 

Se B, B’ são blocos da partição P, a interseção B N B’ é uma face comum a B 
e B'ou é vazia. 

Dada a partição P = Pı x --: x P, do bloco A, como o comprimento b; — a; 
de cada aresta de A é a soma dos comprimentos dos intervalos da partição P;, 
segue-se da propriedade distributiva da multiplicação que o volume do bloco A 
é a soma dos volumes dos blocos B da partição P. Logo, quando Q refina P, o 
volume de cada bloco de P é a soma dos volumes dos blocos de Q nele contidos. 

Se P = Pi x -x P e Q = Q; x -+ x Qn são partições do bloco A, existem 
partições de A que refinam ao mesmo tempo P e Q. Uma delas é 


R=] [|P u gQ». 
i=1 
Seja f : A —> R uma função real limitada no bloco n-dimensional A, digamos 
com m < f(x) < M para todo x € A. Dada uma partição P do bloco A, para 
cada bloco B € P, indiquemos com mp o ínfimo e com Mpg o supremo dos valores 
f(x) quando x varia em B. Definimos então a soma inferior s(f; P) e a soma 
superior S(f; P) da função f relativamente à partição P pondo 


s(f:; P)= Š mg: voB e S(f;P)= X Ms -volB, 
BeP BeP 

estas somas estendendo-se a todos os blocos B da partição P. Evidentemente 
mp < Mp para todo Be P, logo s(f; P) < S(f; P). 

Mais do que isto é verdade: para quaisquer partições P e Q do bloco A, tem-se 
s(f; P) < S(f; Q). 

Para comprovar esta afirmação, observamos primeiro que se uma partição P’ 
refina a partição P então s(f; P) < s(f; P) e S(f; P) < S(f; P). 

Com efeito, se o bloco B’ da partição P” está contido no bloco B da partição 
P então mg < mpg. Lembrando que cada bloco B € P’ é a reunião dos blocos 


B' € P’ nele contidos, e que vol B = 3º vol B”, segue-se que 
B'CB 


Dms =D (E mvts’) 


BeP BeP \B'CB 


bD mp -volB' = s(f: P^). 


B'eP' 


s(f; P) 


IA 


122 CAPÍTULO 8: INTEGRAIS MÚLTIPLAS 


Analogamente se vê que S(f; P) < S(f; P) quando P’ refina P. Assim, quando 
se refina uma partição, a soma inferior não diminui e a soma superior não aumenta. 

Sejam P e Q duas partições quaisquer do bloco 4. Tomemos uma partição R 
de A que refine P e Q simultaneamente. Temos: 


s(f; P) <s(f; R) < S(f; R) < S(f; Q), 


mostrando portanto que s(f; P) < S(f; Q), ou seja, toda soma inferior de f é 
menor do que ou igual a qualquer soma superior. 
Definimos, a seguir, a integral inferior f A f(x)dx e a integral superior 


f af(x)dx da função limitada f : A > R, pondo 


| fod = spse: P) e foras = int sG; P), 
ZA P: A 


o supremo e o ínfimo acima sendo tomadas em relação a todas as partições P do 
bloco A. 
A desigualdade s (f; P) < S(f; Q) implica que 


mvaa < f fœd< f f(x)dx < M -vol A 
LA A 


sem < f(x) < M para todo x € A. 
Diz-se que a função limitada f : A > R é integrável no bloco n-dimensional 
A quando suas integrais inferior e superior coincidem. Escreve-se então 


[tooar= f fod= f foa 
A Joj A 


e este número é chamado a integral de f no bloco A. 

No caso n = 1, o bloco n-dimensional A reduz-se a um segmento de reta e a 
definição de integral acima dada coincide com a queda apresentada no Capítulo 
10 do Volume 1. 

Dada a função f : A —> R, limitada no bloco A C R”, o conjunto ø das somas 
inferiores e o conjunto » das somas superiores de f relativamente às partições P 
de A são subconjuntos do intervalo [m - vol A, M - vol A], onde m < f(x) < M 
para todo x € A. Sabemos que, para quaisquer s e Te S € D,tem-ses < S. Afim 
de que seja sup T = inf D, isto é, que f seja integrável, é necessário e suficiente 
que, dado arbitrariamente £ > 0, existam s € T e S$ e X tais que S—S < £. Mais 
explicitamente: f é integrável se, e somente se, para todo € > O dado, existem 
partições R e Q de A tais que S(f: R) — s(f; Q) < £. Esta condição pode ser 
aperfeiçoada assim: 
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Teorema 1 (Condição imediata de integrabilidade). A fim de que a função li- 
mitada f : A > R seja integrávelno bloco A C R” é necessário e suficiente que, 
para todo £ > O dado, exista uma partição P de A tal que S(f; P)—s(f; P) < €. 


Demonstração. A suficiência é óbvia pois a condição acima claramente assegura 
que supt = inf». Quanto à necessidade, supondo f integrável, ou seja, ad- 
mitindo que supt = inf X, dado € > 0, existem partições Q e R do bloco A 
tais que S(f: R) — s(f; O) < £. Seja P uma partição de A que refine Q e R 
ao mesmo tempo. Então s(f: Q) < s(f; P) < S(f; P) < S(f; R) portanto 
S(f; P)—s(f; P) < S(f; R)-s(f; Q) <e. 

Para todo subconjunto X C A, sejam Mx o supremo e mx o ínfimo dos valores 
f(x), comx e X. Escreveremos ox = Mx — mx e chamaremos wy de oscilação 
de f no conjunto X. 

Às vezes, quando houver necessidade, usaremos a notação mais precisa 
omega(f; X) = My — m, em vez de wy. 


Para toda partição P do bloco A, temos 


S(f; P) —s(f; P) = X Ms —mp)volB = Dos -vol B 


BeP BeP 


Portanto f : A — R é integrável se, e somente se, para todo £ > 0 dado, existe 
uma partição P de A tal que 


Š og- voB <e. 


BeP 


Uma conseqgiiência imediata desta observação é que toda função contínua 
f: A > R é integrável. Com efeito, sendo o bloco A um conjunto compacto, 
a função contínua f é uniformemente contínua. Portanto, dado qualquer € > 0, 
existe ô > 0 tal que x, y € A, |x — y| < ô > |f (x) — f(y)| <e/volA. 

Se tomarmos, em cada aresta [a;, b;] do bloco A = TI[a;, bi], uma partição P; 
cujos intervalos tenham todos comprimento < ô, e adotarmos em R” a norma do 
máximo, então todos os blocos da partição P = P; x---x P, de A terão diâmetro 
menor do que ô. A função f sendo contínua, em cada bloco B da partição P 
existem pontos a, b tais que mp = f(a)e Mp = f(b), pois B é compacto. Então 
wg = Mg — mpg = f(b)— f(a) < e/volA e daí 


E E 
) -vol B — -> 1B = — -vo A =e. 
wp : VO < Vol A VO Vol A VO E 
BeP BeP 


Assim f é integrável. 
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O fato de que toda função contínua f : A —> R éintegrável é muito importante 
mas não é suficiente para nossos propósitos. A fim de definir a integral de funções 
cujos domínios são mais gerais do que blocos, precisamos integrar alguns tipos de 
funções descontínuas. Isto nos leva ao critério de integrabilidade de Lebesgue, o 
qual se baseia na noção de conjunto de medida nula, que abordaremos no parágrafo 
seguinte. 


2 Conjunto de medida nula 


Diz-se que o conjunto X C R” tem medida n-dimensional nula (segundo Lebes- 

gue), e escreve-se med.X = 0, quando, para todo € > O dado, é possível obter 

uma cobertura enumerável X C B; U... U BU... por meio de blocos abertos 
(0,0) 

By C R” tais que 5: vol B} < €. 


k=1 
Evidentemente, se med.X = 0 e Y C X então med. Y = 0. 


Teorema 2. Uma reunião enumerável de conjuntos de medida nula é ainda um 
conjunto de medida nula. 


Demonstração. Sejam X1,..., Xk, ... subconjuntos de R” com med.X, = 0 
[0,0] 

paratodok € N. A fim de provar que X = |] Xy tem medida nula, seja dado e > 0. 
k=1 

Para cada k € N podemos obter uma seqüência de blocos By, Br, ... , By,... 


OO (0,0) 
tais que X, C (U Bri e } volBj < € J24. Então X está contido na reunião 
i=l i=l 
(enumerável) de todos os Bķ;. Dado qualquer subconjunto finito F C N x N, 
existe j € N tal que (k,i) € F =k < jei < j. Logo 


y vol By; < > [vol Bi] < Set <E. 
k=1 b i=1 k=1 


(k,i)EF 


Portanto, seja qual for a maneira de enumerar os B; numa seqüência, 


teremos J` vol By; < £. Assim, med.X = 0. 
ki 


Corolário 1. Todo conjunto enumerável tem medida nula. 


Com efeito, todo conjunto enumerável é reunião dos seus pontos, cada um dos 
quais tem medida nula. 

A definição de med.X = 0, dada acima com blocos abertos, é conveniente 
quando se pretende usar o Teorema de Borel-Lebesgue. Noutras ocasiões, pode 
ser mais adequado empregar blocos fechados. E ainda em certos casos impõe-se o 
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uso de cubos (abertos ou fechados). Essas alternativas são equivalentes, conforme 
veremos agora. 


Teorema 3. As seguintes afirmações a respeito de um conjunto X C R” são 
equivalentes: 


(a) Para todo e > 0 dado, pode-se obter uma cobertura enumerável X C Bı U 


(0,0) 
...-U BU... por meio de blocos abertos By CR" tais que X` vol B; < €. 
k=1 


(b) Vale a afirmação (a), com blocos fechados em vez de abertos. 
(c) Vale a afirmação (a), com cubos abertos em vez de blocos. 


(d) Vale a afirmação (a), com cubos fechados em vez de blocos abertos. 


Demonstração. Mostremos, inicialmente, que (a) < (b). A implicação (a) => (b) 

é imediata, pois X C BU... U BU... implica X C B, U...U BU... 

e vol By = vol By, logo È vol B; < e > E volBų < e. Quanto a (b) > (a): 

dado £ > 0, (b) nos autoriza a obter uma cobertura X C D U... U DU... 

por meio de blocos fechados D; com X vol Dy < £€/2. Ora, para cada k € N, o 

bloco Dk = [| [axi, bri] está contido no bloco aberto Ag = | | (aki — ô, bki + 8) 
i=1 i=1 


onde ô > O pode ser escolhido de modo que vol A, — vol Dy < £/2*+?. (Basta 
notar que vol Ag = || (bx; — azi + 28) é uma função contínua de ô, igual a vol Dy 


i=l 
quando ô = 0.) Então X C A U... U Ak} U..., com 


2 a L e E € 
X vol A <> vi D+» 25 < as R 
k=1 k=1 k=1 


A equivalência (c) <> (d) se prova exatamente do mesmo modo, bastando ob- 
servar que, no argumento acima, se Dg é um cubo então A; também é. 

Resta portanto, provar que (a) <> (c) ou, o que dá no mesmo, que (b) & (d). 
Ora, é óbvio que (d) = (b). Para demonstrar a implicação (b) => (d), começamos 
provando que, dados um bloco B e um número ô > 0, existe um bloco C que é uma 
reunião finita de cubos, contém B e, além disso, vol C — vol B < ô. Isto é imediato 
quando as arestas do bloco B = TI[a;, b;] têm medidas racionais bg — a, = pi/gi. 
Neste caso, o próprio bloco B é uma reunião finita de cubos: basta considerar o 
mínimo múltiplo comum m dos denominadores q; e tomar em cada aresta [a;, b;] 
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m . 
de B a partição P; com ida intervalos, todos de comprimento 1/m. Os blocos 
i 


da partição P = P; x --: x P, do bloco B são cubos de arestas medindo 1/m e 
B é a reunião deles. No caso geral, observamos que, para i = 1,...,n, existem 
números positivos n; ão pequenos quanto se queira, tais que b; — a; +n; é racional. 


Então o bloco C = ta, bi + ni] tem arestas com medidas racionais, logo é 


reunião finita de cubos. Za Além disso, C contém B e a diferença vol C — vol B = 
TI (b; — a; + ni) — I(b; — a;) pode ser tornada tão pequena quanto se deseje, desde 
que os n; sejam suficientemente pequenos. 

Para completar a prova de que (b) = (d), seja dado € a 0. Por (b), existe uma 


cobertura X C B U...U BU... por bloco B; tais que 2 vol B; < £€/2. Como 


acabamos de ver, cada By está contido numa reunião finito ER cubos cuja soma dos 
volumes é menor do que vol By + £/2%+?. Numerando consecutivamente esses 
cubos para k = 1,2,..., chegamos a uma cobertura X C C1 U... UC, U..., 
onde os cubos C, são tais que 


— 2 2 e E € 
X voc, < DOBRA Ds < a 
r=1 k=1 k=1 

Isto completa a demonstração do teorema. 


Teorema 4. Seja f: X > R” uma aplicação lipschitziana no conjunto X C R”. 
Se med. X = 0 então med. f (X) = 0. 


Demonstração. Adotemos em R” a norma do máximo. Seja c > O tal que 
If0)— f@)| < clx — y| para quaisquer x, y e X. Dado arbitrariamente c > 0, 


existe uma cobertura X C CjU...UC;U... onde cada C, é um cubo cuja aresta 
0,0) 0,0) 


mede ag, com p2 vol C; = Dan)” < e/C”". Sex, y e Cr então |x — y| < ap, 


k= 
logo | f(x) — fo) < C: ak. ig significa que, para todo i = 1,... ,n, as i- 
ésimas coordenadas de f(x) e f(y) pertencem a um intervalo J; de comprimento 


c - ap. Portanto f (Cp N X) está contido no cubo || J; = C}, de aresta c - ag, logo 
i=1 


0,0) 
vol C; = C” - (a;)”". Segue-se que f(X) = U f(CENX)CC/U...UC(U 
k=1 


onde 
[0,6] 0.0) z 
CES a e e 
2 A 2 ; = 


Logo med. f (X) = 0. 
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A aplicação mais frequente do Teorema 4 ocorre quando f : U — R” é diferen- 
ciável, com derivada limitada no aberto convexo U C R”. Se|f'(x)| < c paratodo 
x € U então a Desigualdade do Valor Médio nos dá |f(x) — fl) < c- |x — y| 
para quaisquer x, y E€ U, logo f transforma todo conjunto de medida nula X C U 
num conjunto de medida nula f(X) C R”. A fim de entender este resultado para 
funções de classe C! em abertos não necessariamente convexos, com derivada 
limitada ou não, será necessário usar o 


Teorema 5 (Lindelöf). Toda cobertura aberta X C |] U; de um conjunto arbi- 
AEL 
trário X C R” admite uma subcobertura enumerável X CU, U... UU, U... 


Demonstração. Seja B o conjunto dos blocos abertos em R” cujos vértices 

têm coordenadas racionais e cada um deles está contido em algum aberto U, 

da cobertura dada. O conjunto B é enumerável, logo podemos escrever B = 

(Bi, B2,... , Br...) Para cada k € N, escolhamos um índice A, € L tal que 
(0,0) 

B, C U;,. Afirmamos que LJ U;, = U U;. Com efeito, se x € U, então, como 


k=1 AEL 
U, é aberto, existe uma bola aberta de centro x, contida em U;,. Se tomarmos em 


R” a norma do máximo, essa bola é um cubo, cuja aresta podemos supor racional, 
logo é um B. Assim, x € By C U, portanto todo U,,ÀA E L está contido 


0,0) 
na reunião dos U;,,k e N, ou seja JU, C U Un, C U Ur. Segue-se que 
AEL k=1 AEL 


X CU, U... UUU... 


Teorema 6. Seja f : U — R” uma aplicação de classe C! no aberto U C R”. 
Se X C U tem medida nula então f(X) C R” também tem medida nula. 


Demonstração. Para cada x € X existe um aberto convexo Uy, com x € U, C U, 

tal que f tem derivada limitada em U,, logo f(X N U,) tem medida nula. A 
(0,0) 

cobertura aberta X C |] U, admite uma subcobertura enumerável X C (J Up. 
xeX k=1 

Como f(X N Ux) tem medida nula para cada k e N, segue-se que f(X) = 


| D (XN vo | = Ú f(X N Us) tem medida nula. 
k=1 k=1 


Corolário 2. Seja f : U — R” uma aplicação de classe C! no aberto U C R”. 
Sem < n então f(U) C R” tem medida nula. 


Com efeito, se considerarmos R” como o conjunto dos pontos de R” cujas 
últimas n-m coordenadas são nulas, veremos que todo bloco m-dimensional B C 
R” cC R” tem volume n-dimensional nulo, pois podemos cobrir B com um único 
bloco n-dimensional D = B x [0,n]”"”, cujo volume n-dimensional pode ser 
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tomado tão pequeno quanto se deseje. Daí resulta que R”, visto como subconjunto 
de R”, tem medida n-dimensional nula, pois é reunião enumerável de blocos m- 
dimensionais. Em particular, o conjunto U C R” tem medida n-dimensional nula. 
Isto posto, a partir da aplicação f : U —> R”, definamos F : U x R"™ > R” 
pondo F(x, y) = f(x). O conjunto U x0 C UxR""” tem medida n-dimensional 
nula, logo med.F (U x 0) = 0, pelo Teorema 5. Mas F(U x 0) = f (U), o que 
prova o corolário. 


Corolário 3. Seja M C R” uma superfície m-dimensional de classe C!. Sem < n 
então M tem medida n-dimensional nula. 


Com efeito, para todo x € M existe um aberto U, em R” tal que Vy = Ux NM 
é uma vizinhança parametrizada de x, logo um conjunto de medida nula em R”. A 
cobertura aberta M C |] U, admite, por Lindelöf, uma subcobertura enumerável 
M 
[0,6] fs [0,0] 
M C LU Ur, logo M = [J(U:N M) é reunião enumerável de conjuntos V = 


Uz N M “dê medida nula. Assit med.M = 0. 

O teorema seguinte, devido a H. Lebesgue, estabelece o critério geral de integra- 
bilidade em termos de noção de conjunto de medida nula. Em sua demonstração, 
faremos uso do conceito de oscilação de uma função num ponto, que introduzire- 
mos agora. 

Seja f : X — R uma função limitada no conjunto X C R”. Fixemos x € X 
e, para cada ô > 0, ponhamos Q (8) = œ(f; X N B(x; ô)) = oscilação de f no 
conjunto dos pontos de X que distam menos de ô do ponto x. Fica assim definida 
uma função não-negativa Q : (0, +20) — R, a qual é limitada pois f também é. 
Além disso, S2 é não-decrescente. Logo existe o limite 


o(f; x) = lim 2 (ô) = lim o(f; X N B(x; 6) = info(f; X N B(x; 6), 


que chamaremos a oscilação da função f no ponto x. 
Tem-se w( f; x) = 0 se, e somente se, f é contínua no ponto x. É claro que se 
x €int.Y e Y C Xentão o(f;x) < o(f; Y). 


Z 


Teorema 7 (Lebesgue). A função f: A > R, limitada no bloco A C R”, é 
integrável se, e somente se, o conjunto D ș dos seus pontos de descontinuidade tem 
medida nula. 


Demonstração. Suponhamos inicialmente que med. D s = 0. Dado arbitrariamen- 
tee > 0, seja Df C C1U...U C, U... uma cobertura enumerável de D; por 
blocos abertos tais que 5 vol C; < «/2K, onde K = M — m é a diferença entre o 
sup e o inf de f em A. Para cada ponto x € A — D, seja C” um bloco aberto con- 
tendo x, tal que a oscilação de f no fecho de CY seja inferior a e /(2 vol A). Sendo 
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A compacto, a cobertura aberta A C (UCL) U (U CY) admite uma subcobertura 
finita 


AE CU VE UC UnC 
Seja P uma partição de A tal que cada bloco aberto B e P esteja contido num dos 
blocos C, ou num c7. Se A = J [[a;, bi] então podemos tomar P = P; x- -- x P, 


onde, para cada i = 1,..., n, P é formada pelos pontos a;, b; mais as i-ésimas 
coordenadas dos vértices dos blocos C; ou C f que pertençam ao intervalo [a;, b;]. 
Os blocos de P contidos em algum C, serão genericamente designados por B’ e 
os demais blocos de P (necessariamente contidos em algum C n) serão chamados 


B”. A soma dos volumes dos B’ é menor do que £/2K e, em cada bloco B”, a 
oscilação de f não excede £/(2 - vol A). Portanto 


X os .-volB = X or «vol B' + Doom «vol B” 
F 


BeP B” 


E 
K. se = 1B” 
2v0 Ponana 
€ € 
K. VASE, 
u AE T a 


IA 


Segue-se que f é integrável. 


Reciprocamente, suponhamos f integrável. Para cada k e N, ponhamos D; = 
{x e A;w(f;x) > 1/k), logo Df = Di U...U D;U.... Para mostrar que 
Dş tem medida nula, basta provar que med.D, = O para cada k e N. Seja, 
então, dado £ > 0. Como f é integrável, existe uma partição P de A tal que 


> wp-volB < €/k. Indiquemos genericamente com B’ os blocos da partição 
BeP 
P que contêm algum ponto de D, em seu interior. Para cada um desses blocos B’, 


vale wp > 1/k. Portanto 


;DvolB' < X op vol B' < Š og- voB < z 


BeP 


Multiplicando por k, obtemos X vol B’ < e. Ora, é claro que D, C (U B) U X, 
onde X é a reunião das faces próprias dos blocos B e P nos quais há algum ponto 
de D;. Sabemos que med.X = 0. Segue-se daí que med. D; = 0. Isto completa a 
demonstração. 


3 Cálculo com integrais 


Teorema 8. Sejam fg: A > R funções integráveis no bloco A C R” e cum 
número real. Então: 
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d) f+g:A > Ré integrávele [ Ifœ) + gO)ldx = f, fO)dx + 
fa g(x)dx. 


(2) c: f: A — R é integrávele f c- fœ@dx =c- fi fœ@dx. 

(3) O produto f - g : A —> R é uma função integrável. 

(4) Se |e(x)| > k > 0 para todo x € A então fg: A> R é integrável. 
(5) Se f(x) < g(x) para todo x € A então J f(x)dx < Ja g(x)dx. 

(6) |f|: A> R é uma função integrável e ISa Ff(x)dx| < Ja If &œ)|dx. 


(7) Se A' é um bloco contido em A e f(x) = O para todo x € A — A' então 


Si fœ dx= ff dr 


Demonstração. A integrabilidade das funções f +g, c- f, f- g, f/ge|f] resulta 
do Teorema 7, pois Df+ C Df U Dg, Des = Dp (se c Æ 0), Df C Df U Dee 
Dfi C Dp. Além disso, se |g (x)| > k > 0 para todo x € A então f/g: A > R 
é limitada e, como Df; C Df U Dg, o quociente f/g é integrável. As demais 
afirmações do Teorema 8 se provam exatamente como no caso de funções de uma 
única variável. (Ver Capítulo 10 do Volume 1.) 

O cálculo efetivo da integral de uma função f : A —> R, definida num bloco 
n-dimensional, se faz integrando f sucessivamente em relação a cada uma das suas 
n variáveis. Basta aplicar diversas vezes o Teorema 9 abaixo, no qual adotamos as 
seguintes notações: 

Dados os blocos 4, C R” e 4 C R”, os pontos do bloco 4, x A C R”™ 
escrevem-se como (x, y), comx E€ Ajey € A2. Se f : A1 xX A —> Réintegrável, 
sua integral é indicada com f ZA f(x, y)dxdy. Para cada x € Ai, definiremos 
a função fy: A2 —> R pondo f(y) = f(x, y) para todo y € As, portanto f, é 
essencialmente a restrição de f ao bloco n-dimensional x x A2. Mesmo que f seja 
integrável, pode ocorrer que, para alguns valores de x € A1, a função fy : A > R 
não o seja. Com efeito, os pontos em que f é descontínua formam um conjunto 
D de medida nula em R”+” mas pode existir x € A, tal que D N (x x A2) não 
tenha medida n-dimensional nula. 


Exemplo 1. Sejam 44 = A2 = [0,1] e f: [0,1] x [0,1] > R dada por 
f(x,y) = 0 sex Æ 1/2, f(1/2, y) = O se y é racional, f (1/2, y) = 1 se y 
é irracional. O conjunto dos pontos de descontinuidade de f é Ds = 1/2 x [0, 1], 
que tem medida nula em [0, 1] x [0, 1], logo f é integrável. (De fato, sua integral 
é zero.) Mas fi/2 : [0,1] > R é a função igual a zero nos pontos racionais e igual 
a 1 nos irracionais, logo f, : [0,1] > R não é integrável quando x = 1/2. < 
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Teorema 9 (Integração repetida). Seja f : Ajx A2 — R integrávelno produto 
dos blocos A, C R” e A, C R”. Para todo x € Ay seja fy : A2 — R definida 
por LO) = f(x, y). Ponhamos 


AE J Ro e y= J dy. 
“OA 2 


As funções py, Y : Ay > R, assim definidas, são integráveis, com 


| gados J toes J TOS 
Ai Ai AxA? 
isto é: 


J Teruo J ax( f fæ. »dy) = J ax( fæ»); 
Ajx AZ A1 2 A Ai A2 


Demonstração. As partições do bloco 4, x Az são da forma P = P; x Pz, onde 
P, e P, são partições dos blocos A; e Az respectivamente. Os blocos de P são os 
produtos Bı x B2 com Bı € Pı e B2 € P2. Mostraremos que 


s(f; Preso Pi) < S(p; Pi) < S(f; P). 


Daí resultará que q é integrável e que /, p@œ)dx = [4 xa f(x, y)dxdy. Na 
verdade, basta provar a primeira das desigualdades acima, pois a segunda é ób- 
via e a terceira é análoga. Também por analogia, não precisamos provar que 


Ja VO)dx = Ja xa FŒ y)dxdy. 


Começamos lembrando que se X C Y C R então inf.Y < inf.X. Segue-se 
que, para todo bloco Bı x B2 € P; tem-se m(f: Bı x B2) < m( fx; B2), seja qual 
for x € Bı. Portanto 


Do m(f; Bi x Bo) -vol Ba < 5 m(fy: Bo) vol Bo < gx). 


BieP, B€ P2 


Como isto vale para todo x € By, concluímos que: 
Do mf; Bi x Bo) <m(g; Bj). 
B€ P2 


Portanto 


s(f; P) 


y m(f; Bı x B2) - vol Bı x vol B2 
Bı x B2E€P 


> ( ` m(f; By x B») vols) - vol B; 
BieP, B€ P2 


y m(p; Bı) - vol Bı = s(ọ; P1). 
BieP, 


IA 
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Corolário 4. Seja f: A, x A2 x 4 > R integrável no produto dos blocos 
Aı C R”, A C R” e A3 CR”. Então 


J f(x,y, Ddxdydz = J dx f dy f fœ, y, z)dz 
A1XAÁ2X A3 Ai 2 A, Ag 


faf dy f(x,y, dz. 
Al A2 A3 


Com efeito, 


J f(x,y, z)\dxdydz = J dxdy (J f(x,y, oaz) 

A1XA2X A3 Ax Aq A3 

J dx (J a( f(x,y, odz) 
A1 A2 A3 


faf dy f(x,y, dz. 
A1 A2 A3 


A seguir, vamos estender o conceito de integral para funções definidas em certos 
subconjuntos X C R” que não são necessariamente blocos n-dimensionais. 


4 Conjuntos J-mensuráveis 


Dado o conjunto limitado X C R”, seja A um bloco n-dimensional contendo X. 
A função característica de X é a função Ey : A —> R, definida por Ex (x) = 1 se 
x E€ Xeêx(x)=Osex ¢ X. 

Se X e Y são subconjuntos do bloco A, as seguintes propriedades da função 
característica são evidentes: 


1. xuy = Ex + £y — Exnr; 
2. Exnr = &x  Šy; 
3. Tem-se X C Y se, e somente se, Ex < Ey; neste caso, vale Éy. x = £y — éy. 


Segue-se de 1. que Exuy = Ex + £y quando X e Y são disjuntos. 

Se X estiver contido no interior de A (o que poderemos supor, sempre que for 
conveniente) então fr.X é o conjunto dos pontos de descontinuidade da função 
Ex :ASR. 

O volume interno e o volume externo do conjunto limitado X C R” são defini- 
dos, respectivamente, pondo: 


volint x = f Exlx)dx e volex x = f Ex(x)dx. 
Y A A 
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Quando a função característica £y : A —> R é integrável, dizemos que X é J- 
mensurável (mensurável segundo Jordan) e que seu volume n-dimensional é 


voiX = f Extojda. 
A 


O item (7) do Teorema 9 assegura que os conceitos acima introduzidos não 
dependem da escolha do bloco A contendo X. 

Se X C A e P é uma partição do bloco A, as somas inferior e superior da 
função Ey : A — R relativas à partição P são 


s(x; P) = soma dos volumes dos blocos de P contidos em X; 


S(x; P) = soma dos volumes dos blocos de P que intersectam X. 


Portanto, se escrevermos v = vol.int. X e V = vol.ext. X, veremos que, para 
todo £ > 0 dado, existe uma partição P do bloco A (o qual contém X) tal que a 
soma dos volumes dos blocos de P contidos em X é superior a v — £ e a soma dos 
volumes dos blocos de P que intersectam X é inferior a V + €. 


Teorema 10. (1) O conjunto limitado X C R" é J-mensurável se, e somente se, 
sua fronteira tem medida nula. 

(2) Se X,Y C R” são J-mensuráveis então X U Y, X QY e X — Y são J- 
mensuráveis, com 


vol (XUY) = vol X + vol Y — vol (XA Y) 
e vol(X-—Y) = vol X— vol Y quando YCX. 


Demonstração. (1) Tomando um bloco n-dimensional A que contenha X em seu 
interior e considerando a função característica £y : A —> R, temos as equivalên- 
cias: 


X é J-mensurável < Ex éintegrável <> med. Dg, = 0 & med.fr. X =0, 


pois o conjunto Dg, das descontinuidades de £x coincide com a fronteira de X. 
(2) Basta observar que yuy = éx + £y — Exny e que, quando Y C X, vale 
ainda x-y = x — Er. 


Exemplo 2. Todo conjunto limitado X C R”, cuja fronteira é uma superfície, ou a 
reunião de um número finito (ou mesmo enumerável) de superfícies, de dimensão 
n — 1 é J-mensurável. Isto inclui uma bola fechada e a região compreendida entre 
duas bolas fechadas concêntricas. Resulta ainda do item (1) acima que um bloco 
n-dimensional é J-mensurável. < 
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Exemplo 3. Seja X C R o conjunto formado pelo intervalo [0, 1] mais os núme- 
ros racionais do intervalo [1,2]. O “volume” interno do conjunto X é igual a 1 
enquanto seu “volume” externo é 2. Portanto X não é J-mensurável. Tomando o 
produto cartesiano de n cópias de X, obtém-se um subconjunto de R” que não é 
J-mensurável. < 


Exemplo 4. Se X C R” é J-mensurável e int.X = Ø então vol X = O pois 
s(x; P) = O para toda partição P de um bloco que contenha X. Resulta daí que 
se X e Y são conjuntos J-mensuráveis sem pontos interiores em comum então 
vol (X U Y) = vol X + vol Y, pois vol (X NY) = 0. < 


Definiremos agora a integral / x f(x)dx de uma função limitada f : X > R, 
cujo domínio é um conjunto J-mensurável X C R”. Para isto, consideramos um 
bloco n-dimensional A contendo X em seu interior e a função 


f:A>R, 


definida por f(x) = f(x)sex € Xe f(x) =0Osexe A — X. Pomos então, por 
definição 


forca = | f(x)dx e fotcoas= | fœ)dx. 
Lx 2 A X A 


Diremos que f : X > R é integrável quando tivermos 


J foods = | fO)dx 
x X 


ou seja, quando f : A —> R for integrável. 

Se f : A R é descontínua num ponto x € A, ou f é descontínua no ponto x 
ou x pertence à fronteira de X. Noutros termos, D; C D; Ufr.X. Como fr.X tem 
medida nula, segue-se que f é integrável (ou seja, f é integrável) se, e somente se 
o conjunto Ds dos seus pontos de descontinuidade tem medida nula. 

Valem, evidentemente, para a integral / x f(x)dx as mesmas regras operatórias 
estabelecidas no Teorema 9 para o caso em que X é um bloco retangular. 


5 A integral como limite de somas de Riemann 


Mostraremos agora (veja o Teorema 12) que a integral f x f (x)dx é o número real 
cujos valores aproximados são as “somas de Riemann” X f(E;)vol X;, obtidas 
quando se faz uma decomposição do tipo X = X,U...U Xk, onde os X; são 
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conjuntos J-mensuráveis, dois a dois sem pontos interiores em comum, tomando- 
se arbitrariamente É; e X; para cada i — 1,...,k. Esta é a forma mais comu, e a 
mais intuitiva, de se pensar na integral. Passemos às definições precisas. 

Seja X C R” um conjunto J-mensurável. Diz-se que D = (X,,..., Xk) é 
uma decomposição de X quando os conjuntos X,,..., Xy são J-mensuráveis, 
sem pontos interiores em comum (isto é, X; N X; C fr.X; Nfr.X; quando i £ j), 
com X = Xı U... U X,. A norma da decomposição D é o número |D| = 
max.diam.X; = maior diâmetro dos conjuntos X1,..., Xp. 

Por exemplo, se X C R” é um bloco n-dimensional, toda partição P determina 
uma decomposição X = Bı U ... U By, onde os B,, onde os B; são os blocos da 


partição P. 
Seja f : X — R uma função limitada no conjunto J-mensurável X C R”. 
Dada a decomposição D = (X,,..., X) de X escreveremos, para cada i = 


1,...,k, m; = inf.{f (x); x e XijeM, = suplf(x);x € X;). Definiremos 
então a soma inferior s( f, D) e a soma superior S( f; D) pondo 


k k 
s(f; D) = m-volX; e S(f; D) = È` M; - vol X;. 
i=] i=1 


Diz-se que o número real J é o limite de S(f; D) quando |D| tende a zero, e 
escreve-se 


di eT D) 


para significar que, para todo € > 0 dado, existe ô > O tal que |D| < 
ô > |J— S(f; D)| < £. Analogamente se define o significado da afirmação 
[= ua D). 


Teorema 11. Para toda função f : X > R, limitada no conjunto J-mensurável 
X CR”, tem-se 


f Sod = Jim sD) e J fdr = lim SG; D). 


Na demonstração do Teorema 11 usaremos o lema abaixo, cujo enunciado 
contém a desigualdade d(X;, Y) < ô. 

Se A e B são subconjuntos não-vazios de IR”, costuma-se escre- 
ver d(A, B) = inf.{|x — yl; x € A, y € B}. Por conseguinte, a desigualdade 
d(A, B) < ô significa que existem x € A e y € B com |x — y| < ô. 


Lema 1. Sejam Y C X C R” J-mensuráveis, com vol Y = 0. Para todo € > 0 
dado, existe ô > O tal que, se D é uma decomposição de X com |D| < ô então a 
soma dos volumes dos conjuntos X; € D tais que d(X;, Y) < 8 é menor do que e. 
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Demonstração. Dado s > 0, podemos cobrir Y com uma coleção finita de blocos 
B cuja soma dos volumes é < €. Tomando arbitrariamente ô > 0, ponhamos 
cada um desses blocos B = II [a;, b;] dentro do bloco B’ = TI [a; — 26, b; + 26]. 
Como lim vol B’ = vol B, existe ô > 0 tal que a soma dos volumes dos blocos B’ 


ô— 


é ainda menor do que £. Usando a norma do máximo, podemos assegurar que se 
Z é um conjunto de diâmetro < ô tal que d(Z, B) < ô então Z C B’. Portanto, 
se D = (X,,..., Xx) é uma decomposição de X com |D]| < ô, vemos que 


d(X;, Y) < 6 => d(X;, B) < ô para algum B > X; C B’. 


Assim, a soma dos volumes dos conjuntos X; € D tais que d(X;, Y) < ô não 
excede a soma dos volumes dos blocos B’, logo é menor do que e. 


Demonstração do Teorema 11. Basta provar a segunda afirmação. Sem perda de 
generalidade, podemos admitir que O < f(x) < K para todo x e X. Com efeito, 
se somarmos uma constante c à função c, tanto a integral superior como o limite 
acima serão aumentados de c - vol X. Seja f : A — R a extensão de f aum bloco 
n-dimensional A D X, com f(x) = 0 se x € A — X. Dado £ > 0, queremos 
achar ô > 0 tal que |S(f; D) — J fœ)dx| < & para toda decomposição D de X 
com |D| < ô. Ora, dado £ > 0, existe uma partição P, de A tal que 


S(f; Po) <J fœ)dx +e/2. 
x 


Seja Y a reunião das faces próprias dos blocos de P,. Como vol Y = 0, o Lema 
assegura a existência de ô > O tal que, para toda decomposição D de X com 
|ID| < ô, a soma dos volumes dos conjuntos X; € D com d(X;, Y) < ô é menor 
do que £€/2K. 

Seja então D uma decomposição de X com norma |D| < ô. Chamemos de 
Xw os conjuntos de D tais que d(X«, Y) < ô. Os demais conjuntos de D serão 
chamados de Xg. Notemos que cada Xg deve estar contido em algum bloco da 
partição P, pois, do contrário, existiriam x, y € Xg em blocos distintos de P,, 
logo o segmento de reta [x, y] conteria algum ponto de Y. Como |x — y| < ô, 
isto daria d(Xg, Y) < ô um absurdo. Escrevendo M, = sup{ f(x); x E Xa} e 
Mg = sup{ f (x); x € Xp), vem 


S(f; D) = Do Ma -vol Xa + Mp vol Xp, onde 
X Ma vol Xa < K. È vol Xa < €/2 e 


X Mp- vol Xg = Di bo Mp vol Xp) < >; Mp -volB 


BeP, *XpCB BeP, 
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= S(f; P,) <J fœdx + £/2. 
X 


Assim, |D| < ô > S(f; D) < [f(x + e/2. 

Mostraremos agora que S(f; D) > f y f(x)dx para toda decomposição D de 
X. Com efeito, seja Z a reunião das fronteiras dos conjuntos X; da decomposição 
D. Como vol Z = 0, o Lema nos dá ô’ > 0 tal que, para toda partição P do bloco 
A com |P| < ô’, a soma dos volumes dos blocos de P que intersectam Z é menor 
do que £/K. Tomando |P| < 6”, temos 


SCF: PJ=5> Mg- vl B+ Me-volC, 


onde chamamos de B os blocos de P que intersectam Z e de C os que estão 
contidos no interior de algum X; € D. (Observe que, pelo Teorema da Alfândega, 
um bloco que não esteja contido no interior de algum X;, deve intersectar Z, pois 
todo bloco é conexo.) Ora, temos 


Š Ms- volB < K-> volB<e e 


a Me -volC = 5 se Me -volC) < Dm(D wic) 


i CCX; CCX; 


IA 


DM vox; = S(f; D). 


Logo f y f (œ&)dx <S(f;P)<S(f;D)+e. 
Como € > O é arbitrário, concluímos que f xyf(x)dx < S(f; D) para toda 
decomposição D de X. Isto conclui a demonstração. 


Corolário 5 (da demonstração). Para toda função limitada f : X —> R no con- 
junto J-mensurável X C R", tem-se 


J dx = supscf; D) e J Fods = int sG; D). 
Zx R X A 


P4 


Uma decomposição pontilhada do conjunto J-mensurável X C R” é um 


par D* = (D, £), onde D = (X1,... , Xx) é uma decomposição de X e É = 
(Ei, ... , ék), com & € X1,... , Ek E€ Xg. Em termos menos formais, pontilhar 
a decomposição D = (X1,... , Xy) é escolher um ponto É em cada conjunto 


Xoi=1,...,k. 
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A toda partição pontilhada D* fica associada a soma de Riemann © (f; D*) 
definida por 


k 


DF D)=5 fé) vX. 


i=l 


Diz-se que o número 7 é o limite das somas de Riemann È (f; D*) quando a 
norma |D| tende a zero, e escreve-se 


m= lim >, (D 


quando, para todo £ > O dado, pode-se obter ô > 0 tal que, para toda decomposição 
D do conjunto X com norma |D| < ô tem-se |E (f; D*) — I| < £, seja qual for 
a maneira D* de se pontilhar D. 


Teorema 12. Se f: X > R é integrável no conjunto J-mensurável X C R" 
então 


x)dx = lim È (f; D* 

f tcodr= tim E G; D> 

Demonstração. Para toda decomposição D de X tem-se 
s(f; D) < $` (f; D®) < SQ; D), 


seja qual for o modo D* de pontilhar D. Pelo Teorema 11, temos ne S(f; D) = 


fg Fœdx. 
Segue-se imediatamente que o E (f; D) = fe fœ)dx. 


Capítulo 9 


Mudança de Variáveis 


Demonstraremos neste capítulo o importante Teorema da Mudança de Variáveis 
em integrais múltiplas. 

Começaremos estabelecendo as notações. 

U e V são abertos do espaço euclidiano R”; h : U —> V é um difeomorfismo 
de classe C!. 

X é um subconjunto compacto J-mensurável de U. A fronteira de X, que 
tem medida nula, está contida em X (logo em U) e sua imagem por h, que é a 
fronteira do compacto A(X), tem medida nula (Teorema 6, Capítulo 8). Portanto 
h(X) também é um conjunto J-mensurável. 

Finalmente, f : h(X) — R é uma função integrável. 

O Teorema da Mudança de Variáveis diz que a seguinte igualdade é verdadeira: 


J aE J Pieps kiik odi. 
h(X) X 


Ela é análoga para n variáveis daquela estabelecida no Vol. 1. (Vide Teorema 
2, Capítulo 11.) Notam-se, porém, algumas diferenças. 

A função que, no caso de uma só variável, desempenhava o papel de h não 
precisava ser um difeomorfismo. Para n > 1, entretanto, pelo menos injetividade 
de h (ou algo equivalente) se faz necessário, sem o que a fórmula não vale. (O 
estudo dessas situações gerais leva à noção de grau, que é analisada em detalhe no 
livro “Curso de Análise”, Vol. 2.) 

Outra diferença é o valor absoluto em | det h’ (x)|. É natural que o determinante 
substitua a derivada h'(x) pois, quando n > 1, esta não é um número; mas o valor 
absoluto que ocorre na fórmula acima não parece estar presente quando n = 1. Na 
verdade, porém, ele está oculto na igualdade 


h(b) b 
Í sod= f fh) -h (x)dx. 


(a) 
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De fato, se chamarmos de 1 o intervalo [a,b] e J = h(I) o intervalo cujos 
extremos são h(a) e h(b), teremos h(a) > h(b) quando h’ < 0, logo a fórmula 
acima significa, em qualquer caso, que 


f Fars / FAO): Gar. 


pois 


h(b) 


J ional TOn se MRON 


h(a) 
isto é, 


h(a) 


rS é J OA FOB 
J h(b) 


se h(b) < h(a), isto é, se h'(x) < 0. 
O Teorema de Mudança de Variáveis será provado por etapas. 


1 O caso unidimensional 
Dado o intervalo 7 = [a, b], escreveremos |I| = b — a. 


Teorema 1. Sejam U, V CR abertos, h:U —> V em difeomorfismo C!, I C U 
um intervalo compacto, J = f (I)e f : J > R uma função limitada. Então 


| row = | row -IK Q)ldx. 


Demonstração. Sem perda de generalidade, podemos admitir que f(y) > 0 para 
todo y € J pois, se somarmos a mesma constante positiva c a ambos os membros 
da igualdade acima, o lado esquerdo sofrerá o acréscimo de c - | J| enquanto o 
acréscimo sofrido pelo lado direito será de c - f q Ik (x)|dx. Como h'(x) não muda 
de sinal para x € J, o valor desta integral é c - |h(b) — h(a)| = c - |J | também. 
Esta observação nos deixa livres para manipular desigualdades. 


As partições de J = h(I) são do tipo h(P), dadas por intervalos da forma 
J; = h(I), onde os Z (r = 1,... ,k) são os intervalos de uma partição P de 7. 
Para cada r, ponhamos M, = sup f(y) = sup f (h(x)) e c, = sup |k’ (x)|. 


ye, xel, xel, 
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Pelo Teorema do Valor Médio, para cada r = 1,...,k existe É e Z, tal 
que |J,| = |k" (E) - |Z]. Pondo n, = c, — |h'(&,)|, temos n, > 0, em virtu- 


de da continuidade uniforme de h’ no intervalo T, ns n, = 0. Segue-se que 
k 

lim 1,| = O pois 

ua nll] =0p 


k k 


0< $ mlh] < (maxn,) -$ 11 < (max) II. 


r=l r=l 


Então 


k k k 
SCF; hP) = 5 M, -J= Ñ M,C- Ý nlll e 
r=1 r=1 r=1 


k 
Do Mb, 
r=l 


pois se g, : A —> R são duas funções não-negativas limitadas quaisquer 
então sup(p(x), Y(x)) < supy(x) - sup Y (x). Logo, para toda partição P do 
A xEA xeA 


S(foh)-|h'; P) 


XE 
intervalo T, vale: 


k 
SC(F o h) -|h'|; P) < S; hP) +X ml. 


pe, 


Segue-se que 


| row WO- dx = irt S((F © h): |h'l; P) 


IA 


lim srne» = f fO)dy. 
[P|>0 J 


A desigualdade oposta, f, fOdy < f, fh (x))-|h'(x)|dx, resulta da anterior, que 

vem de ser provada, usando-se h! : J > Iemvezdeh, foh : I —> R em vez de 

f elevando em conta que, para todo y = h(x), x € I, tem-se (A (9) = 1/h' (x). 
Então concluímos que 


J fOd= J FOO) God. 
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2 Difeomorfismos primitivos 


O próximo caso particular que consideraremos é aquele em que h é um difeomor- 
fismo primitivo. 
Chamam-se primitivos os difeomorfismos h de um dos dois tipos seguintes: 
Tipo 1. São fixados os índices i, j, com 1 <i < j <neh: R” > R” é dado 
por 


h(x) = nO ris q A eee s Xa) = ia O a Xn). 
Tipo 2. Tem-se uma função q : U —> R, de classe C!, e para todo x € U vale 


h(x) = (o(x), X2,... , Xn). 


Teorema 2. Seja h : R” > R” um difeomorfismo primitivo do Tipo 1. Para todo 
conjunto J-mensurável X C R” e toda função integrável f : h(X) —> R tem-se 


J toD / tio | deth'QOJdz . 
h(X) X 


Demonstração. O difeomorfismo h é um operador linear, com deth'(h) = —1 
para todo x € R”, logo | deth'(x)| = 1. Devemos, portanto, mostrar que 
Jæ fO)dy = fy f(h(x))dx. Ora, para todo bloco B C R”, sua imagem 
h(B) é também um bloco, com arestas de mesmo comprimento que as de B, lo- 
go volh(B) = vol B. Como o volume de um conjunto J-mensurável Z C R” 
é o ínfimo dos números Xvol B;, onde os B; = volZ. Toda decomposição 
h(X) = Yı U... U Y é tal que Y; = h(X,), onde X = X, U... U X, é uma 
decomposição de X. Todo ponto de Y; é da forma h($;), com & e X;. Logo 


f 10% = lim >, FCh(E)) -vol Y; 


im E SAED vX = f faas. 


Teorema 3. O Teorema de Mudança de Variáveis em Integrais Múltiplas é válido 
quando X C R” éum bloco retangulareh : U —> V é um difeomorfismo primitivo 
do Tipo 2. 


Demonstração. Por conveniência, escreveremos os pontos de R” sob a forma 
x(s, w), com s € Re w e R™!, e consideraremos o bloco X = I x A como 
produto cartesiano do intervalo 7 = [a, b] pelo bloco A C R"-!. Note-se que, 
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para todo w € A fixado, a função py : s œ> q(s, w) = I é um difeomorfismo do 
intervalo Z sobre o intervalo Jy = Pwy (I) = (I x w). Observemos ainda que 
a matriz jacobiana de h tem a primeira linha igual ao gradiente de ọ e, a partir 
E segunda linha, coincide com a matriz identidade n x n. Portanto det h'(x) = 

p 
ðs - 
w e A. Então A(X) C J x A. Como de praxe, f : J x A —> R é a função 
integrável, igual a f nos pontos de A(X) e igual a zero nos demais pontos de 
J x A. Então o Teorema 1 nos permite escrever: 


(s, w) = øl, (s). Seja J C R um intervalo compacto contendo J, para todo 


J fO)dy = f(t, w)dtdw = J f(t, w)dt dw 
h(x) JxA 


h(x) 


J (f juoar au = Í (E pis ar) a 
| (| tuts. w) li)dsido 


fo(s, w), w) - | deth'(s, w)lds dw 
A 


Ix 


J f(h(x)) - | det h'(x)|dx . 
X 


3 Todo difeomorfismo C! é localmente admissível 


Seja D o conjunto dos difeomorfismos de classe C! para os quais é válido o Teorema 
de Mudança de Variáveis. Os elementos de D serão chamados difeomorfismos 
admissíveis. 

Como sabemos, o objetivo deste capítulo é provar que todo difeomorfismo 
de classe C! é admissível. Acabamos de ver que os difeomorfismos primitivos 
pertencem a D. Além disso, como 


det ((h o 5) (x)) = det Aí (h2(x)) - det h3 (x), 
vê-se imediatamente que hı o ha € D quando h; € D e h € D. 
Por exemplo, todo difeomorfismo da forma 
h(x) = tais , Xj-1, P), Xj+1; ->> Xn) 


é admissível pois é composto de dois difeomorfismos primitivos. 

Nesta seção, provaremos que todo difeomorfismo de classe C! é localmente 
admissível. Este é o conteúdo do teorema seguinte, o qual, evidentemente, é um 
resultado provisório. 
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Teorema 4. Sejah: U —> V um difeomorfismo de classe C! entre abertos de R”. 
Todo ponto de U possui uma vizinhança, restrita à qual h é admissível. 


Demonstração. Basta provar que, dado xo € U, se h é definido numa vizinhança 
de xo e tem a forma 


h(x) =p) sc PC) Karla o Xn) 


então existe um difeomorfismo k, de classe C!, composto de difeomorfismos pri- 
mitivos, cuja imagem é uma vizinhança de xo, tal que 


h(k(w)) = (Yı (w), ... , Yj- (w), Wj, ... , Wn). 


Ora, as j primeiras linhas da matriz jacobiana de h são os vetores 
grad g1, ... , grad o; e as demais linhas coincidem com as da matriz identidade 
n x n. Compondo h, se necessário, com um difeomorfismo do Tipo 1, podemos 


do: 
admitir que TE (o) < 0. Pelo Teorema 5 do Capítulo 6 (aplicado à função q ;) 
E 


existe um difeomorfismo admissível 
k: w> ss O Wj41,--- , Wn) 


cuja imagem é uma vizinhança de xo tal que ø;(k(w)) = wj para todo w no 
domínio de k. Então 


h(k(w)) = (pı (k(w", ... , pj- (k(w)), Wj, ..., Wn), 


completando assim a demonstração. 


4 Conclusão: todo difeomorfismo de classe C! é admissível 


Para terminar a demonstração do Teorema de Mudança de Variáveis, vamos usar 
um resultado topológico elementar que estabeleceremos agora. 


Seja X C U C, uma cobertura do conjunto X C R”. Diz-se que ê > 0 é 
AEL 
um número de Labesgue dessa cobertura quando todo subconjunto Y C X com 


diâmetro < ô está contido em algum C;. Isto equivale a dizer que, para todo 
x € X, o conjunto X N B(x; 6/2) está contido em algum C;. 


Teorema 5. Toda cobertura aberta X C |) A, deumconjunto compacto X CR” 
AEL 
possui número de Lebesgue. 
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Demonstração. Se o teorema fosse falso existiriam, para cada n € N, um ponto 
Xn E€ X e um número ô, > Otais que lim ô, = 0e XN B(x,; ôn) não estaria contido 
em A, qualquer que fosse À € L. Passando a uma subsegiiência, se necessário, 
podemos admitir que lim x, = xo € X. Seja Ao E L tal que xo E€ A1. Como As, 
é aberto, existe r > O tal que B(x9;r) C A}. Tomemos n € N tão grande que 
|Xn — xol < r/2 e ôn <r/2. Então B(xn; ôn) C B(xo; r), logo B(Xn; ôn) C Ars 
um absurdo. 


Exemplo 1. Seja X = A; U 4 C R°. A cobertura aberta formada por A; = 
(x,y) € R?; x > 0, y > 1/2} e A = {(x, y) € R?; y < 0} não possui número 
de Lebesgue. 


Com efeito, dado qualquer ô > 0 seja p = (x, —y) com x > 0, y > 0e 


1 
— + y < — então X N B(p; ô/2) é um subconjunto de X com diâmetro < ô, o 


x 
qual não está contido em A; nem As. < 


Teorema 6. Sejam X C R” um conjunto compacto J-mensurável, h: U > V 
um difeomorfismo de classe C! entre abertos U, V CR" e f : h(X) > R uma 
função integrável. Então 


J DE J Fe dK a. 
h(X) X 


Demonstração. Existe uma cobertura aberta X C |] Wẹ, C U tal que a restrição 


de h a cada W, é um difeomorfismo alaisia Seja ô > 0 um número de 
Lebesgue dessa cobertura. Tomamos uma decomposição D = (X — 1,..., Xx) 
de X tal que cada conjunto X; tenha diâmetro inferior a ô. (Para obter D, basta 
tomar uma partição P de um bloco A contendo X de modo que os blocos B; de P 
tenham arestas < ô na norma do máximo, ou < ô/./n na norma euclidiana. Em 
seguida, ponha X; = B; N X.) Então 


fody =5) | fody=5) f. SG) | det HGldx 


76.9) 7 AN(X5) 


J f(h(x)) -| det kh'(x)|dx . 
X 


Corolário 1. Seja T : R” > R” um operador linear. Para todo conjunto com- 
pacto J-mensurável X C R” tem-se vol T (X) = | det T| - vol X. 


Basta aplicar o Teorema 5 à função característica Ex em lugar de f, observando 
que é suficiente considerar o caso em que T é invertível. 


